高通量测序(High-throughput sequencing),又称“下一代”测序(Next-generation sequencing),是近年来在测序技术发展史中具有革命性改变的新突破,能一次并行对几十万到几百万条DNA分子同时测序,因此能对物种的转录组和基因组进行比以往较细致全貌的分析。

  但是,由于“下一代”测序技术原始数据的读长(read length)只有几十个或一、两百个碱基,按照传统的分析流程,必须要通过生物信息学工具将这些短的碱基数据组装成较长的序列组(contigs)或基因组的框架,或者把这些序列比对到已有的参照基因组或者相近物种基因组序列上,才能进一步取得具有生物学意义的结果。对于没有参照基因组的非模式生物,要把这些海量的短序列数据组装的工作面临一定程度上的难度,制约了这类数据在非模式生物基因组研究的发展。

  考虑到大部分生态学研究里的热带生物都是没有参照基因组的非模式生物,在中科院西双版纳热带植物园生态进化组Cannon研究员的领导下,版纳植物园、北京基因组所及德州理工大学的科研人员研发了直接分析高通量短序列数据的程序包,简化了高通量数据的比较基因组和转录组研究。由于此方法不需事先组装基因组,而以直接通过分析检测数据中的kmer片段是否存在及其出现频次,来探讨一定数量目标基因组中的序列差异,所以可以突破此类数据经常面临的生物信息学的分析瓶颈。通过筛选单个基因组独有或多个基因组共享的kmer片段及找出含这群kmer片段的数据后,此程序可以对这些数据进行组装,以取得较长的序列探讨下一步的生物学问题。

  基于先前的工作基础(见已在Molecular Ecology 发表的论文,CANNON, C. H., KUA, C.-S., ZHANG, D. and HARTING, J.R. (2010), Assembly free comparative genomics of short-read sequence data discovers the needles in the haystack. Molecular Ecology, 19:147–161),研究人员进一步改善了非组装分析法,以比较174个叶绿体全基因组数据印证此程序包的功能和运行流程,并于PlOS ONE发表了题为Reference-Free Comparative Genomics of 174 Chloroplasts的论文。

  由于这174个由低等植物和高等植物组成的叶绿体全基因组分析涉及的内容十分广泛,研究人员只能简洁的阐述几个发现,如虽然植物叶绿体基因组的基因结构和含量看起来十分保守,但是kmer片段分析可以把不同支流的植物清楚的分类。寄生植物的叶绿体基因组表现出预期的整体进化加速,而半寄生植物比全寄生植物的叶绿体基因组中含有较多的新基因序列,印证了基因组的演化机制受控于其功能。研究也发现了一段在被子植物里非常保守的基因序列。这分析里所有的成果都在该文章的补充材料部分。

  此程序包内有4个不同功能的程序,可用LINUX和苹果操作系统以命令行运行。程序包已上传到全球最大开源软件开发平台sourceforge。

  此研究得到了中国科学院知识创新工程重要方向项目和云南省高端科技人才引进计划项目的资助。

相关文章

遗传年龄或可评估自闭症和精神分裂症患者脑组织衰老速度!

自闭症(ASD)和精神分裂症(SCZ)是常见的慢性精神疾病,在行为、遗传学和神经病理学等方面存在相当多的重叠特征,提示自闭症和精神分裂症可能存在共同的神经发病机制。衰老与表观遗传效应的动态变化密切相关......

我国科研团队发布水稻完整参考基因组

水稻是重要的粮食作物,其基因组组装对水稻育种意义重大。23日,记者从中国农业科学院深圳农业基因组研究所获悉,该所联合崖州湾实验室、中国水稻研究所、中国农科院作物科学研究所和扬州大学等多个单位发布完整的......

星赛生物牵头国家重点“高通量拉曼流式细胞分选仪”项目

8月8日,青岛市人民政府会议中心迎来国家重点研发计划“基础科研条件与重大科学仪器设备研发”重点专项2022年度青岛部市联动项目启动会顺利召开。科技部基础司、中国21世纪议程管理中心、中国科学院前沿科学......

南京大学高通量非靶向筛选质谱仪485万元公开招标

南京大学高通量非靶向筛选质谱仪公开招标公告2023年07月31日公告信息:采购项目名称南京大学高通量非靶向筛选质谱仪品目货物/通用设备/仪器仪表/分析仪器/质谱仪采购单位南京大学行政区域江苏省公告时间......

转移性肿瘤与原发性肿瘤之间的基因组差异是什么?

肿瘤转移性扩散涉及肿瘤细胞从原发性肿瘤中分离、迁移、二次组织定植和生长的多步骤过程。分析原发性肿瘤和转移性肿瘤之间的基因组差异,并量化它们对治疗耐药性的影响有助于研究和利用治疗干预措施,建立更有效、更......

CREST技术一种高通量谱系示踪的新方法

7月17日,《自然-方法》在线发表了中国科学院脑科学与智能技术卓越创新中心、神经科学国家重点实验室陈跃军研究组撰写题为《利用CRISPR条形码技术全面绘制小鼠脑内的单细胞时空谱系》的研究论文。该研究通......

新一代帕洛马天文台光谱仪通过国际评审

7月12日至13日,由北京大学、中国科学院国家天文台、南京天文光学技术研究所与美国加州理工学院联合研制的新一代帕洛马天文台光谱仪(NGPS)通过国际评审。该项目是北京大学牵头的国家自然科学基金委员会国......

重大突破!染色质扩展显微镜技术可破解基因组秘密

开启或关闭基因的能力是我们在细胞、个体甚至在健康和疾病方面观察到的多样性的基础。这个过程被称为基因转录,涉及到将储存在我们的DNA中的信息转化为RNA。在此之前,科学家们一直依靠不精确的图解和间接的实......

人工智能快速解码脑癌基因组

美国哈佛大学医学院团队设计了一种人工智能(AI)医疗工具,可快速解码脑肿瘤的DNA,以确定其在手术过程中的分子身份,而现有方法需要几天甚至几周的时间才能获得这些关键信息。研究成果7日发表在《医学》杂志......

新进展!构建新型双碱基编辑器

碱基编辑器是基于CRISPR/Cas9发展的新一代基因组编辑技术,可诱导单个碱基的突变,而鲜有关于特异性介导A-to-G和C-to-G双突变的碱基编辑工具的研究。此外,关于碱基编辑系统与染色质环境之间......