发布时间:2015-05-25 14:35 原文链接: 基因组数据分析的“金标准”

  五月十八日,美国安大略癌症研究所、俄勒冈健康与科学大学、赛智生物网络(Sage Bionetworks)、分布式DREAM 团体(Dialog for Reverse Engineering Assessment and Methods)和加州大学圣克鲁兹分校的癌症研究人员,在《Nature Methods》发表了ICGC-TCGA-DREAM Somatic Mutation Calling (SMC) Challenge(The Challenge: https://www.synapse.org/#!Synapse:syn312572)的第一批结果。这些结果为研究人员提供了一个重要的新基准,有助于定义识别癌症基因组中体细胞突变的最准确的方法。这些结果可能是“创建一个新的国际标准,来确定如何很好地检测到癌症突变”的第一步。延伸阅读:两篇论文解析多个基因组数据的新型整合模型。

  Challenge开始于2013年十一月,公开选拔研究团体,解决对“从全基因组测序数据中识别肿瘤相关基因突变的精确方法”的需求。虽然肿瘤基因组测序是爆炸式的,但是根据数据分析的方式不同,在一个给定基因组中所确定的基因突变,可能相差多达50%。

  研究团队被要求分析三份虚拟(计算机模拟)的肿瘤样本,并公开分享他们的方法。248个独立分析是由世界各地的团队协助开展,并由Challenge组织者进行分析和比较。当这些分析组合在一起时,为我们提供了一种新的集成算法,优于目前用于基因组数据分析的任何一种算法。

  本文的作者也还报道了一种计算方法——BAMSurgeon(由共同第一作者Adam Ewing开发),能够产生肿瘤基因组的一个精确模拟。与来自真实组织样本的肿瘤基因组形成对比,Challenge组织者对于所模拟的肿瘤基因组内的所有突变有一个完整的认识,从而能对所有提交的方法所产生的误差、以及它们识别已知突变的精确度,进行综合评估。

  所提交的方法在精确度方面有显著差异,许多方法获得的精确度小于80%,而有些方法则可达到90%以上。也许更令人惊讶的是,25%的研究团队通过优化他们现有算法的参数,使其性能提高了至少20%。这表明,现有方法应用的差异,是至关重要的——也许比方法本身的选择更重要。

  该研究小组还表明,假阳性(预测有突变,但实际上并没有存在),并不是随机分布在基因组中,而处于非常具体的地点,而且更重要的是,误差实际上非常类似于以前被认为代表真实生物信号的一些突变模式。

  本文共同第一作者、安大略癌症研究所生物信息学家Kathleen Houlahan与Challenge 带头人Paul Boutros共同合作,他指出:“总的来说,这些研究结果表明,分析人类基因组的最佳方法是使用多种算法的集合,共同合作科研可获得很多的价值。世界各地的人们已经在使用我们研制的工具。这只是Challenge的第一个发现,随着我们数据的完成和分析结果,还有更多的发现与其他研究团体分享。”

  俄勒冈健康和科学大学计算生物学主任Adam Margolin博士说:“现在,科学是一项团队运动。作为一个研究团体,我们都处于对抗共同敌人的同一队伍中。作为一个全球团体,我们会赢的唯一途径是,解决全球最大、最具挑战性的问题,并快速发现和建立最好的创新技术。”

相关文章

我国科研人员找到导致反复“试管”失败的“基因钥匙”

10月16日,记者从中信湘雅生殖与遗传专科医院获悉,该院研究员林戈、副研究员郑伟团队,联合山东大学、上海交通大学医学院等单位的科研团队开展合作攻关,系统揭示了卵子与早期胚胎质量问题导致女性反复“试管”......

因美纳推出5碱基解决方案以驱动多组学发现,开启基因组与表观基因组的同步洞察

• 在美国人类遗传学会(ASHG)年会上,因美纳5碱基解决方案的早期试用客户——伦敦健康科学中心研究所将展示该技术在加速罕见病病例解析方面的强大潜力。• 因美纳专有的5碱基化学技术......

许瑞明研究组合作揭示人逆转座子LINE1靶向整合基因组的重要机制

人类基因组中存在大量具有"跳跃"能力的逆转座子(retrotransposon)序列。在胚胎发育早期、免疫和神经系统等特定阶段和环境下,它们会被激活,发挥重要生理功能;在病毒感染、......

衰老如何改变我们的基因

衰老对身体产生的可见影响有时与基因活动的无形变化有关。DNA甲基化的表观遗传过程会随着年龄增长而变得不再精确,造成基因表达的变化。而这种变化与随着年龄增长而出现的器官功能衰退和疾病易感性增加有关。如今......

高精度完整基因组助橡胶育种驶入“快车道”

橡胶树是天然橡胶的主要来源。“橡胶树育种面临的主要困难在于周期长和效率低,通过常规育种方法将多抗、高产性状聚合往往需要30~40年。”中国热带农业科学院橡胶研究所研究员程汉告诉《中国科学报》。然而,目......

小麦野生近缘种基因组“密码”被破解

记者宋喜群、冯帆从山东农业大学获悉,该校农学院教授孔令让研究团队首次组装了小麦远缘杂交常用物种中间偃麦草和鹅观草染色体水平的高质量基因组序列,解析了二者基因组结构差异与独立多倍化演化路径,对两者携带的......

为何有人衰老更快?揭秘背后的400个基因

有些人比同龄人更显年轻,而有些人看着更显老;有些人年逾九旬仍身心康健,而另一些人早在数十年前就饱受糖尿病、阿尔茨海默病或行动障碍的困扰;有些人能轻松应对严重摔伤或流感侵袭,而有些人一旦住院就再难康复。......

烟草分枝发育的“开关基因”被发现

近日,中国农业科学院烟草研究所烟草功能基因组创新团队发现烟草分枝发育“开关基因”,预示着未来作物株型调控有了新靶点。相关研究成果发表在《植物生物技术》(PlantBiotechnologyJourna......

新研究破译薇甘菊入侵基因密码

薇甘菊作为全球十大最具危害的恶性入侵杂草之一,以其惊人的繁殖速度和强大的环境适应性,在亚洲、太平洋地区及中国华南地区造成严重生态破坏。然而,其基因组层面的适应性进化机制长期未被系统解析,制约了科学防控......

研究开发出酵母泛基因组数字模型与代谢网络分析方法

近日,中国科学院大连化学物理研究所研究员周雍进团队与上海交通大学副教授鲁洪中合作,在酵母系统生物学研究中取得新进展。研究团队通过整合分析全球1807株酿酒酵母菌株的基因组与生态位数据,构建了高覆盖度的......