发布时间:2016-10-27 15:27 原文链接: 山大泰山学者李国君教授再发转录组组装新法

  生物通报道:山东大学首批泰山学者特聘教授、博士生导师李国君教授,1996年毕业于中科院数学与系统科学学院获博士学位,曾在美国、澳大利亚、香港和韩国多所大学工作或访问。2004年曾受聘为中科院软件所兼职研究员,2005年被聘为美国佐治亚大学资深研究员。主要研究领域为生物信息学、系统生物学、图论和组合最优化,相继在各类学术杂志上发表学术论文100余篇。

  在去年3月份,李国君教授和黄秀珍博士带领的团队,在国际杂志《Genome Biology》发表一项研究,提出了一种新的转录组组装方法——Bridger,旨在为两种大众组装方法——基于参考序列的Cufflinks和从头组装方法Trinity——之间搭建一种桥梁关系。具体来说,他们采用Cufflinks所用的主要技术,来克服Trinity技术的局限性,因此开发出了一种更加先进的的从头组装方法(山大泰山学者发布新的转录组组装方法 )

  今年3月份,李国君教授带领的课题组,联手美国阿肯色州立大学的研究人员,在国际著名学术杂志《PLOS Computational Biology》发表一项研究,提出了一种新的从头组装方法——BinPacker。结果表明,在所有数据集中,BinPacker优于几乎所有比较的组装软件。(山大泰山学者再发转录组组装新方法)

  在2016年10月19号,李国君教授带领的课题组,与加州大学河滨分校的研究人员合作,又在《Genome Biology》杂志发表一项重要学术成果,题为“TransComb: genome-guided transcriptome assembly via combing junctions in splicing graphs”。李国君教授和加州大学河滨分校的姜涛(Tao Jiang)教授是本文共同通讯作者。姜涛教授早年毕业于中国科技大学,并于美国明尼苏达大学获计算机科学博士学位,目前是加州大学河滨分校计算机系终身教授、清华大学客座教授、“长江学者”特聘教授。本文第一作者是李国君教授的博士生柳军涛。

  这项研究指出,最近的研究已经揭示了真核生物转录组无穷的复杂性和多样性。为了了解可变剪接在多外显子蛋白编码基因中的确切机制,科学家们开展了计算和实验研究。最近发表的一项研究表明,与可变剪接一起翻译的蛋白质,可以被电子显微镜捕获,这清楚地阐明了可变剪接的机制。然而,要阐明真核生物中的可变剪接机制,仍然是一个非常具有挑战性的任务。

  为此,该研究小组提出了一种新的基因组引导性转录组组装程序——TransComb。TransComb是根据一副节点图发展而来的,由bin-packing策略和paired-end信息确定权重。新设计的扩展方法基于加权节点图,可以准确地提取表示表达的转录本的路径——无论它们的表达水平是高还是低。

  值得一提的是,bin-packing策略最早是在该研究小组以前的从头组装程序BinPacker中开发的,用于结合剪接图,但是它被巧妙地应用于TransComb,连同paired-end信息一起来引导上述提到的加权节点图上所有全长转录本的精确提取。在来自多个物种的真实数据和模拟数据上进行测试,研究人员发现,TransComb比所有四种比较领先的组装程序(包括StringTie、Cufflinks、Bayesembler和Traph)表现得更为出色。例如,在人类K562数据集、人类H1细胞数据集和小鼠树突状细胞数据集上,TransComb可正确组装的全长转录本分别比Bayesembler多23%、12%和13%。此外,它通常运行地比Cufflinks和Bayesembler更快,并且比其他组装程序需要更少的内存。