发布时间:2014-11-21 09:30 原文链接: 震惊!Genbank参考基因组序列多处错误!


 震惊!Genbank参考基因组序列多处错误!

  随着基因组测序技术的飞速发展以及测序成本的快速降低,全基因组数据也在急速增加。尽管参考基因组数据是非常有价值的资源,但是由于测序过程中的外源污染或者研究者对数据组装方法的误用,使得基因组数据面临很多问题。

  近日,约翰霍普金斯大学的研究者在《Peer J》上发表一项研究,发现Genbank上存储的动植物基因组草图中存在细菌及病毒污染。这些物种间交叉污染会给微生物分析的发展造成很多问题,例如,即便在动物测序数据中出现部分基因序列可以证明生命起源,但实际上这部分序列可能是来自是微生物污染。该研究的另一个惊人的发现是,在奶牛和绵羊的基因组草图中发现了淋球菌!

  尽管Genbank上存储的基因组被认为是完整的,但一些细菌的基因组其实是含有多处DNA插入错误的草图。从1995年,测序获得了第一个细菌全基因组——流感嗜血杆菌基因组,到现在,Genbank数据库上存储了大约2万7千个原核生物基因组以及1千6百个真核生物基因组。但绝大部分数据是基因组草图,序列中存在多处gap(漏洞),而后续分析都是基于这些不完整的基因组草图。如果不深入分析判断,很可能认为只是基因水平转移引起这些错误,因此需要更科学的、正确的分析基因组中出现的错误。

  基因组测序的第一步是提取DNA,根据物种的不同,获取DNA的方式也是各式各样。对于动物,通常从血液中提取DNA,但是像昆虫这样的微小动物,需要从整个个体中提取测序所需的DNA。从DNA提取到测序,都存在污染的可能性。计算机对测序原始数据的过滤只能去除例如大肠杆菌一类实验室常见污染,对于其它种类的污染是很难去除的。

  需要强调的是,不仅要对即将发表的基因组进行仔细筛查,还包括那些已经发表的数据。

相关文章

基于深度学习的全基因组选择新方法诞生

近日,中国农业科学院作物科学研究所、三亚南繁研究院大数据智能设计育种创新团队联合多家单位提出利用植物海量多组学数据进行全基因组预测的深度学习方法,可以实现育种大数据的高效整合与利用,将助力深度学习在全......

科学家在人类身上发现155个新基因!都是“从0出现”

“人类又偷偷进化不带上我?”虽然是个段子,不过新研究发现,人类的基因整体确实发生了进化——来自欧洲的一群科学家对新发布的人类基因数据集进行了研究,发现了155个“独特”的基因。要知道,虽然新基因也可以......

创造记录!这篇发表19天Science文章由于污染问题而被撤回

2021年11月中旬在非洲南部首次发现的SARS-CoV-2Omicron变种(BA.1)的地理和进化起源仍然未知。2022年12月1日,洪堡大学CarloFischer等人在Science在线发表题......

新发现155个基因表明人类仍在不断进化

从近700万年前的黑猩猩祖先进化而来的现代人类仍在继续进化。据20日发表在《细胞报告》杂志上的新研究介绍,科学家已经在人类谱系中发现了155个新基因,这些基因是从人类DNA的微小片段自发产生的。这些新......

云舟生物:基因递送向精尖奋力驶向新蓝海

在广州高新技术开发区科学城园区“双创”示范基地有一家企业——云舟生物科技(广州)股份有限公司(以下简称云舟生物),致力于系统性攻克基因递送行业的关键技术瓶颈,独创高度个性化的智慧基因载体设计交易平台,......

近900万|四川省人民医院二代测序招标项目启动

病理科“同源重组修复基因突变联合检测和缺陷基因检测”等及2022年“肺癌治疗靶点检测”等二代测序合作检测项目(二次)的潜在投标人应在四川省政府采购一体化平台项目电子化交易系统(以下简称“项目电子化交易......

早年间的生活经历或许会对机体基因表达产生持久影响

来自伦敦大学学院等机构的科学家们通过研究发现,早期的生活经历或会影响机体基因的活性,甚至还会影响机体的寿命。一种短暂的、自我平衡转录反应会导致转录记忆并能重编程随后的转录输出,转录记忆在改变动物衰老方......

世界重大害虫马铃薯块茎蛾高质量基因组破译

 马铃薯块茎蛾形态特征和危害症状。中国农科院植保所供图近日,中国农业科学院植物保护研究所经济作物虫害监测与防控创新团队联合国内外多家单位,组装了茄科作物的世界重大害虫马铃薯块茎蛾的染色体水平......

猕猴桃高密度SNP基因分型芯片研发成功

软枣猕猴桃新种质。中国农科院郑果所供图不同基因型的软枣猕猴桃果实。中国农科院郑果所供图不同猕猴桃种质资源的果实。中国农科院郑果所供图近日,中国农业科学院郑州果树研究所猕猴桃资源与育种团队在《植物生物技......

药典委|微生物全基因组测序技术指导原则标准草案公示

近日,国家药典委员会拟定微生物全基因组测序技术指导原则标准草案并公示。其中提到实验室需具备高通量核酸测序仪、核酸扩增仪、片段分析仪、核酸定量仪、生物安全柜、混匀器、高速离心机、水浴或加热模块、冰箱、微......