发布时间:2016-02-24 17:25 原文链接: 大大加速基因组分析的新软件

  最近,新加坡科技研究局(A*STAR)基因组研究所(GIS)和生物信息学研究所(BII)的科学家带领的一个国际研究小组,开发出了一种可以加快基因组分析的软件——SIFT 4G(SIFT for Genomes)。这项研究结果发表在《Nature Protocols》杂志。

  基因组测序可帮助我们提高对于人类疾病的认识,让科学家了解其基本的生物学机制。它也对于推动全球精准医学起到了关键作用,一种疾病或患者的基因档案,可在为患者确定预后和治疗策略的时候,提高临床决策,从而为提高医疗效果铺平了道路。

  而技术进步已经产生了大量关于“人体和其他生物”的数据,科学界所面临的一个问题在于,如何很好地分析如此大量的数据。

  根据其前身的同样原则,SIFT 4G可以在更高的速度上进行基因组预测。一旦预测准备好,它们就被存储在数据库中,并准备用于基因组分析。图形处理器(GPUs)——而不是中央处理单器(CPUs)的使用,可使预测时间更短,并能够为大量生物构建数据库。SIFT 4G已经为200多种生物提供了预测,从而可以为更大的研究群体服务。

  之前,为SIFT预测创建一个数据库,科学家要花25天的时间、在个10个CPUs上,现在,使用SIFT 4G,在一个GPU上、只需要三天的时间,就能建好。通过使用GPU而不是CPU,一个蛋白质的加工时间可从4.2分钟大幅减少到2.6秒。一旦预测准备好,研究人员就可以使用数据库,在短短五分钟的时间内分析基因组。

  基因组分析效率的提高,将使研究界能够推进科学技术的发展,开发造福人类健康的技术。BII和GIS开发的生物信息学和基因组学能力,使这两家研究机构在快速、准确解释生物数据以了解基因功能、它们之间的相互作用以及疾病的发展中,发挥了关键的作用。

  除了提高医疗效果这个明显的好处之外,基因组测序也在农业领域以及基础研究,带来了重大的进展。对相同生物的不同品种或品系进行测序,可使我们对其显著特性的遗传基础有所了解。

  例如,目前已对3000多个水稻基因组进行了测序,来解释某些性状(如耐冷性和作物品质)背后的遗传多样性。这些类型的调查,可以产生巨大的影响,因此有人估计,测序市场在农业和其他行业的应用价值将超过70亿美元。基础研究也得益于基因组测序的兴起;例如,果蝇的基因组序列,已被用于更好地理解进化过程的基础。

  该研究的通讯作者是GIS的Pauline Ng博士——15年前,她与其博士生导师、Fred Hutchinson癌症研究中心(FHCRC)的Steven Henikoff和Jorja Henikoff教授一起研发了SIFT运算法则。Ng博士说,“我很激动,因为SIFT 4G将使研究生物体突变的研究人员能够更快地有所发现。现在,研究生物体(基因组已经测序)遗传变异的任何研究人员,都可以用SIFT 4G来表征他们的错义突变。其对许多基因组的扩展功能,将使世界各地的研究人员能够使用它作为不同项目的资源。”

  BII执行董事Frank Eisenhaber博士说:“新的算法和处理器架构,对于处理生物数据库中收集的大量数据来说,是必不可少的,这往往超过了计算机性能的进步。这仅仅是生物信息学和计算生物学可以被用来推进生物过程的研究和理解的一种方式。”

  GIS执行主任Ng Huck Hui教授说:“时间是至关重要的,尤其当涉及到研究领域的时候更是如此。我们必须能够很快适应,以跟上不断变化的医疗保健和生物医学前景;SIFT 4G是我们这样一种强大的工具。它将加快基因组分析的时间,只会为研究群体和广大公众带来益处。”

  现在基因组测序成本越来越低,测一个基因组一个课题组都能承担下来,但是后续的基因组信息挖掘可不是容易的事。在这之前,就相继报道过多种新的基因组分析方法。

相关文章

高精度完整基因组助橡胶育种驶入“快车道”

橡胶树是天然橡胶的主要来源。“橡胶树育种面临的主要困难在于周期长和效率低,通过常规育种方法将多抗、高产性状聚合往往需要30~40年。”中国热带农业科学院橡胶研究所研究员程汉告诉《中国科学报》。然而,目......

小麦野生近缘种基因组“密码”被破解

记者宋喜群、冯帆从山东农业大学获悉,该校农学院教授孔令让研究团队首次组装了小麦远缘杂交常用物种中间偃麦草和鹅观草染色体水平的高质量基因组序列,解析了二者基因组结构差异与独立多倍化演化路径,对两者携带的......

烟草分枝发育的“开关基因”被发现

近日,中国农业科学院烟草研究所烟草功能基因组创新团队发现烟草分枝发育“开关基因”,预示着未来作物株型调控有了新靶点。相关研究成果发表在《植物生物技术》(PlantBiotechnologyJourna......

新研究破译薇甘菊入侵基因密码

薇甘菊作为全球十大最具危害的恶性入侵杂草之一,以其惊人的繁殖速度和强大的环境适应性,在亚洲、太平洋地区及中国华南地区造成严重生态破坏。然而,其基因组层面的适应性进化机制长期未被系统解析,制约了科学防控......

研究开发出酵母泛基因组数字模型与代谢网络分析方法

近日,中国科学院大连化学物理研究所研究员周雍进团队与上海交通大学副教授鲁洪中合作,在酵母系统生物学研究中取得新进展。研究团队通过整合分析全球1807株酿酒酵母菌株的基因组与生态位数据,构建了高覆盖度的......

基因组大数据还原野猪横跨欧亚的百万年迁徙历程

近日,中国农业科学院农业基因组研究所农业基因编辑技术创新团队深入解析了中亚野猪种群在跨越欧亚大陆百万年的迁徙历程中适应环境的独特遗传密码,为理解大型哺乳动物如何应对环境变化提供了全新视角。相关研究成果......

基因组密码被解锁:深度学习模型破解非编码区奥秘

人类基因组中超98%的遗传变异位于非编码区,这些变异通过调控染色质可及性、三维构象、剪接加工等多种分子机制影响基因表达,最终导致疾病发生。由于调控机制的复杂性和细胞类型特异性,目前解读非编码变异的分子......

“女娲”基因组计划发布第八项成果

近日,中国科学院生物物理研究所徐涛研究组和何顺民研究组在《基因组、蛋白质组与生物信息学报》杂志发表论文。两位科学家牵头的“女娲”中国人群基因组计划旨在构建中国人群的全基因组数据资源,支撑中国人群的疾病......

适应雨林?古人类混血?东南亚人群基因组被破译

中外团队历时10年,在东南亚人群基因组研究领域取得里程碑式突破。北京时间14日晚,“东南亚人群基因组计划”首期成果发表在国际期刊《自然》上,东南亚人群的遗传演化之谜被揭开。论文通讯作者之一、中国科学院......

东南亚人群基因组计划首期成果发表

东南亚是全球最重要的人类演化区域之一。该地区人群拥有极高的遗传多样性,但基因组学研究长期缺失,制约了人类环境适应性进化与疾病遗传机制的深度解析,因而被称为全球人类基因组研究“最后一块拼图”。中国科学院......