发布时间:2020-04-01 10:31 原文链接: Decodeseq方法显著提高差异表达基因分析的准确性

  鉴定差异表达基因是许多生物医学研究项目的基础步骤,利用转录组进行差异表达(Differential Expression, DE)分析是目前最主流的方法,得到了广泛应用。例如,两个常用于转录组DE分析的算法 edgeR 和 DESeq2 已经被引用了超过上万次。

  在DE分析中,如果使用的生物学重复数不足,会影响到结果的准确性,生物统计学家们长期以来呼吁要提高重复数。然而,由于传统转录组方法的实验流程较为复杂昂贵,大多数研究仅使用 2-3 对生物学重复。使用这么少重复数的分析,敏感性(sensitivity)较低,只有差异表达最显著的基因才能被鉴定出来;错误发现率(FDR)也很高,结果中存在大量的假阳性。因此,需要一种新的实验方法,有效解决生物学重复不足的问题,提高DE分析的准确性。

  中国科学院遗传与发育生物学研究所屠强研究组开发了一种新的转录组实验方法,称为Decode-seq。该方法利用多种分子标签,可以在一个测序文库中同时检测数十个样品,大幅降低了建库成本;富集转录本5’端测序,相比全长测序降低了测序成本,也避免了3’端测序造成的困难;文库结构兼容通用测序流程,不需要定制参数,可以与任意标准文库同时上机,因此对测序量要求也非常灵活。与传统转录组方法相比,Decode-seq的成本降低到约10%,非常适用于大规模的DE分析。在验证实验中,使用30对重复的DE分析结果相对于3对重复,敏感性从31% 提高到 95%,错误发现率从 34% 降低到 14%,显著改善了结果的准确性。Decode-seq 方法还可以应用于微量样品,例如对青鳉鱼发育早期的雌雄性腺进行多达30对重复的转录组分析,鉴定出了多个雌雄差异表达基因,其中一些被证明对生殖细胞的正常发育是必须的。

  综合这些结果可知,大幅增加生物学重复可以显著提高差异表达基因鉴定的准确性,而Decode-seq 为此提供了一个可行的实验方法。因此,除非因样品珍贵、需要研究转录本全长等原因,否则应避免仅使用2-3对生物学重复的转录组分析策略。Decode-seq 方法的实验流程和分析程序都已经在研究组主页上提供下载。

  该成果于3月23日正式发表于Genome Biology 杂志(DOI:10.1186/s13059-020-01966-9),文章标题为Decode-seq: a practical approach to improve differential gene expression analysis。屠强研究组博士研究生李莹姝为该论文的第一作者,屠强为该论文的通讯作者。该研究得到国家自然基金和中科院先导项目的资助。

1.jpg

图:(a-b)使用3对和30对重复的验证实验,红色为真阳性,黄色为假阳性,灰色为真阴性,蓝色为假阴性。(c) 对30对重复的结果进行抽样计算表明,随着重复数的增加,差异基因鉴定的准确性也得到了大幅提高。


相关文章

牛津大学:过量饮酒会直接加速人体衰老!

牛津大学的一项大规模的基因分析研究表明,饮酒导致端粒缩短,从而直接加速衰老。这项研究发表在《分子精神病学》杂志上。酒精可以为人们带来快乐,同时也对健康产生一定影响。研究表明,酒精会永久性地损害DNA,......

Decodeseq方法显著提高差异表达基因分析的准确性

鉴定差异表达基因是许多生物医学研究项目的基础步骤,利用转录组进行差异表达(DifferentialExpression,DE)分析是目前最主流的方法,得到了广泛应用。例如,两个常用于转录组DE分析的算......

Decodeseq方法显著提高差异表达基因分析的准确性

鉴定差异表达基因是许多生物医学研究项目的基础步骤,利用转录组进行差异表达(DifferentialExpression,DE)分析是目前最主流的方法,得到了广泛应用。例如,两个常用于转录组DE分析的算......

Decodeseq方法显著提高差异表达基因分析的准确性

鉴定差异表达基因是许多生物医学研究项目的基础步骤,利用转录组进行差异表达(DifferentialExpression,DE)分析是目前最主流的方法,得到了广泛应用。例如,两个常用于转录组DE分析的算......

遗传发育所等发现小麦抗白粉病基因

串联激酶蛋白(tandemkinaseprotein,TKP)含有两个激酶结构域,是在麦类作物(小麦和大麦)中发现的一种新类型的抗病基因。目前从麦类作物中已经克隆到的串联激酶基因有大麦抗秆锈病基因Rp......

遗传发育所在植物着丝粒研究中取进展

基因组测序及解析以及新技术的广泛应用,让人们得以继续探索着丝粒和端粒等染色体上高度重复区域在生命活动中的新功能。植物着丝粒含有丰富的重复序列,如串联重复序列(Satellite)和反转座子(Retro......

遗传发育所:植物内质网相关蛋白质降解机制综述文章

植物在整个生活史中面临多种非生物和生物胁迫,一直以来科学家对于植物如何响应环境胁迫并协调生长发育和胁迫响应之间的关系进行着系统而深入的研究。蛋白质泛素化修饰是一种重要的蛋白质翻译后修饰,主要通过影响蛋......

遗传发育所开发水稻分子育种整合组学知识库

10月18日,中国科学院遗传与发育生物学研究所植物基因组学国家重点实验室梁承志研究组开发的分子育种整合组学知识库水稻子库在线发表于学术期刊《核酸研究》(NucleicAcidsResearch)。文章......

遗传发育所发现参与植物赤霉素代谢的新成员

赤霉素(gibberellins,GAs)是一类非常重要的植物激素,参与许多植物生长发育等多个生物学过程。在开花植物中,13-羟化赤霉素(生理活性低,例如GA1)和13-氢赤霉素(生理活性高,例如GA......

中科院遗传发育所453万采购微升液相/多维高清质谱系统

分析测试百科网讯近日,中国科学院遗传与发育生物学研究所微升液相/多维高清质谱系统采购项目发布,预算金额453万元,招标文件如下:项目名称:中国科学院遗传与发育生物学研究所微升液相/多维高清质谱系统采购......