数据可重复性一直以来都是实验生物学的一个主要问题,随着基因组技术的发展以及相关数据复杂性的不断提高,这一问题的严重性又得到了很大程度地提升。
11月12日,特拉维夫大学的Shir Mandelbaum,Zohar Manber,Orna Elroy-Stein和Ran Elkon在《PLOS Biology》上发表文章,指出RNA-seq技术产生的数据经常出现技术偏差,进而导致错误的结论。
通过分析数十个可公开获得的,针对细胞对多种不同压力的反应的RNA-seq数据集合, Mandelbaum及其同事注意到,长度过短或过长的基因集合反复显示出表达水平的变化。

(图片来源:Www.pixabay.com)
作者对此感到困惑,然后试图搞清楚这一现象背后究竟是真实的生物学反应,还是实验过程引入的人为误差。为了解决这个问题,他们比较了相同生物学条件下的重复批次的样本。重复样品之间基因表达的差异可以反映与生物学因素无关的技术性影响。结果表明,在不同的重复中,长度过短或过长的基因都显示出“表达差异”,因此这一现象似乎是基因长度差异引起的“技术性误差”。
RNA-seq实验的主要目的是表征受特定因素影响而被激活或抑制的生物学过程。Mandelbaum及其同事证明,在许多RNA-seq数据集中,基因长度偏差以及统计分析中的一些缺陷会导致对特定生物学功能出现错误识别。通过消除这种偏见,能够滤过滤虚假信息,同时保留了生物学上真实信息。
资讯出处:Widespread misinterpretation of gene expression data
原始出处:Shir Mandelboum, Zohar Manber, Orna Elroy-Stein, Ran Elkon. Recurrent functional misinterpretation of RNA-seq data caused by sample-specific gene length bias. PLOS Biology, 2019; 17 (11): e3000481 DOI: 10.1371/journal.pbio.3000481
华南农业大学教授刘柏平团队与香港科技大学讲师常富杰、华南师范大学教授罗琼团队合作,首次揭示染色质物理特性中的DNA压缩密度是驱动染色质拓扑关联结构域形成的关键因素,为理解基因组三维结构形成机理提供了全......
表观遗传指的是在不改变DNA序列的情况下,基因表达和生物性状的可继承变化。细胞命运决定包括细胞身份的维持和转换,这就涉及到表观遗传信息的继承性和可塑性,是生命科学领域的重点前沿方向。生命的"......
4月30日,华南理工大学食品科学与工程学院黄明涛教授课题组对酿酒酵母中的未折叠蛋白响应元件(UPRE)进行了改造,并应用于基因表达的动态调控。该成果以“TailoredUPRE2variantsfor......
科技日报北京4月1日电 (记者张梦然)美国马萨诸塞大学阿默斯特分校生物学家领导的跨学科小组最近发表了一项史无前例的研究:调查了18种灵长类动物的基因表达与大脑进化之间的联系。研究成果发表在《......
1月16日,中国科学院分子细胞科学卓越创新中心研究员周小龙、王恩多团队在《核酸研究》(NucleicAcidsResearch)上,发表了题为Multifacetedrolesoft6Abiogene......
DNA甲基化是最早发现的表观遗传标记之一,在真核细胞基因表达调控中发挥重要作用。随着DNA甲基化检测技术的进步,研究发现DNA甲基化具有完全甲基化和半甲基化两种状态,以及可以稳定遗传的半甲基化修饰。关......
细胞分裂素(cytokinin)是一种重要的植物激素,在植物的生长发育中扮演着多种角色,包括维持分生组织、促进维管组织分化、调控叶片衰老和促进再生等。以往研究表明,细胞分裂素的信号传递类似于细菌的双组......
几十年来,科学家们已经知道,“垃圾DNA(junkDNA)”实际上起着至关重要的作用:尽管基因组中的蛋白编码基因提供了构建蛋白的蓝图,但是基因组中的一些非编码部分,包括以前被认为是“垃圾DNA”的基因......
12日,同时发表在《科学》《科学进展》和《科学·转化医学》杂志上的21项研究,公布并详细解释了迄今为止最全面的人类脑细胞图谱。这些研究对3000多种人类脑细胞类型进行了特征分析,阐明了某些人类脑细胞与......
8月7日,中国科学院动物研究所翟巍巍/马亮团队在《自然-通讯》(NatureCommunications)上,发表了题为SONARenablescelltypedeconvolutionwithspa......