高通量测序(High-throughput sequencing),又称“下一代”测序(Next-generation sequencing),是近年来在测序技术发展史中具有革命性改变的新突破,能一次并行对几十万到几百万条DNA分子同时测序,因此能对物种的转录组和基因组进行比以往较细致全貌的分析。
但是,由于“下一代”测序技术原始数据的读长(read length)只有几十个或一、两百个碱基,按照传统的分析流程,必须要通过生物信息学工具将这些短的碱基数据组装成较长的序列组(contigs)或基因组的框架,或者把这些序列比对到已有的参照基因组或者相近物种基因组序列上,才能进一步取得具有生物学意义的结果。对于没有参照基因组的非模式生物,要把这些海量的短序列数据组装的工作面临一定程度上的难度,制约了这类数据在非模式生物基因组研究的发展。
考虑到大部分生态学研究里的热带生物都是没有参照基因组的非模式生物,在中科院西双版纳热带植物园生态进化组Cannon研究员的领导下,版纳植物园、北京基因组所及德州理工大学的科研人员研发了直接分析高通量短序列数据的程序包,简化了高通量数据的比较基因组和转录组研究。由于此方法不需事先组装基因组,而以直接通过分析检测数据中的kmer片段是否存在及其出现频次,来探讨一定数量目标基因组中的序列差异,所以可以突破此类数据经常面临的生物信息学的分析瓶颈。通过筛选单个基因组独有或多个基因组共享的kmer片段及找出含这群kmer片段的数据后,此程序可以对这些数据进行组装,以取得较长的序列探讨下一步的生物学问题。
基于先前的工作基础(见已在Molecular Ecology 发表的论文,CANNON, C. H., KUA, C.-S., ZHANG, D. and HARTING, J.R. (2010), Assembly free comparative genomics of short-read sequence data discovers the needles in the haystack. Molecular Ecology, 19:147–161),研究人员进一步改善了非组装分析法,以比较174个叶绿体全基因组数据印证此程序包的功能和运行流程,并于PlOS ONE发表了题为Reference-Free Comparative Genomics of 174 Chloroplasts的论文。
由于这174个由低等植物和高等植物组成的叶绿体全基因组分析涉及的内容十分广泛,研究人员只能简洁的阐述几个发现,如虽然植物叶绿体基因组的基因结构和含量看起来十分保守,但是kmer片段分析可以把不同支流的植物清楚的分类。寄生植物的叶绿体基因组表现出预期的整体进化加速,而半寄生植物比全寄生植物的叶绿体基因组中含有较多的新基因序列,印证了基因组的演化机制受控于其功能。研究也发现了一段在被子植物里非常保守的基因序列。这分析里所有的成果都在该文章的补充材料部分。
此程序包内有4个不同功能的程序,可用LINUX和苹果操作系统以命令行运行。程序包已上传到全球最大开源软件开发平台sourceforge。
此研究得到了中国科学院知识创新工程重要方向项目和云南省高端科技人才引进计划项目的资助。
南亚地区的人们以酸奶、印度奶酪和印度酥油等乳制品为食。现在,这一地区正帮助解开一个长期存在的谜题:人类是如何获得消化牛奶的能力的。一项针对印度、巴基斯坦和孟加拉国现代及古代人类基因组的研究表明,一种能......
一项发表在最新一期《自然》杂志上的研究,通过对生活在10200至150年前的南非个体基因组进行分析,证实了在南部非洲,一群智人在半隔离的状态下生活了数十万年。这是迄今规模最大的对非洲古代DNA的研究,......
• 在美国人类遗传学会(ASHG)年会上,因美纳5碱基解决方案的早期试用客户——伦敦健康科学中心研究所将展示该技术在加速罕见病病例解析方面的强大潜力。• 因美纳专有的5碱基化学技术......
人类基因组中存在大量具有"跳跃"能力的逆转座子(retrotransposon)序列。在胚胎发育早期、免疫和神经系统等特定阶段和环境下,它们会被激活,发挥重要生理功能;在病毒感染、......
橡胶树是天然橡胶的主要来源。“橡胶树育种面临的主要困难在于周期长和效率低,通过常规育种方法将多抗、高产性状聚合往往需要30~40年。”中国热带农业科学院橡胶研究所研究员程汉告诉《中国科学报》。然而,目......
记者宋喜群、冯帆从山东农业大学获悉,该校农学院教授孔令让研究团队首次组装了小麦远缘杂交常用物种中间偃麦草和鹅观草染色体水平的高质量基因组序列,解析了二者基因组结构差异与独立多倍化演化路径,对两者携带的......
近日,中国农业科学院烟草研究所烟草功能基因组创新团队发现烟草分枝发育“开关基因”,预示着未来作物株型调控有了新靶点。相关研究成果发表在《植物生物技术》(PlantBiotechnologyJourna......
薇甘菊作为全球十大最具危害的恶性入侵杂草之一,以其惊人的繁殖速度和强大的环境适应性,在亚洲、太平洋地区及中国华南地区造成严重生态破坏。然而,其基因组层面的适应性进化机制长期未被系统解析,制约了科学防控......
近日,中国科学院大连化学物理研究所研究员周雍进团队与上海交通大学副教授鲁洪中合作,在酵母系统生物学研究中取得新进展。研究团队通过整合分析全球1807株酿酒酵母菌株的基因组与生态位数据,构建了高覆盖度的......
近日,中国农业科学院农业基因组研究所农业基因编辑技术创新团队深入解析了中亚野猪种群在跨越欧亚大陆百万年的迁徙历程中适应环境的独特遗传密码,为理解大型哺乳动物如何应对环境变化提供了全新视角。相关研究成果......