发布时间:2012-12-21 00:00 原文链接: 专家指南:如何开展基因表达研究(三)

  Q4:您在分析基因表达数据时通常借助哪些生物信息学工具?

  Gary Hardiman(加州大学圣地亚哥分校)

  • 利用内部脚本对读取进行QC

  • 定位到参考基因组(Bowtie 2)

  • 新的剪接检测(Cufflinks)

  • 转录本定量(FPKM)

  • 差异表达分析(edgeR, SAMR, cuffdiff)

  • 选定基因或转录本的覆盖图

  • 基因本体和通路分析

  • 互作组分析(gene networks)

  Chris Harrington(俄勒冈健康与科学大学)

  我们使用仪器供应商提供的软件来初步处理每个表达谱平台的数据。我们实验室一般不提供全面的数据分析,因此在交付数据后,许多客户使用开源的软件工具,或与生物信息学机构合作。这些机构对RNA-seq或芯片分析很有经验,他们通常使用开源软件或定制流水线。我们认为GeneSifter、 Partek Genomics Suite和MetaCore相对易用,且能满足很多客户的要求,特别是小的非临床研究。

  Ralph Schlapbach(瑞士联邦理工学院)

  对于芯片基因表达分析,我们依赖R/Bioconductor。这个框架为芯片分析的每一步提供了专用的软件包:预处理、标准化、差异表达计算和基因本体分析。Bioconductor软件包具有以下特征:支持所有厂商的所有芯片类型,执行最新的统计模型,支持重复研究,是开源的。具体来说我们使用 Affymetrix的软件包来预处理Affy数据。对于其他芯片类型,我们自己编写流水线来执行预处理步骤。

  对于NGS转录组数据的分析,我们依赖tophat来进行读取定位。我们评估数据质量,检查污染物,评估属于重复的读取比例,并评估片段大小分布、 3’-偏向和剪接点的覆盖度。对于差异表达,我们依赖Bioconductor软件包的edgeR。我们利用goseq软件包对基因列表进行功能注释。对于相关通路的深度挖掘,我们建议使用一个商业软件产品,如GeneGo的MetaCore,因为它们的通路数据库比公开的通路资源更全面,更准确。

  Q5:您如何确定绝对表达水平?

  Gary Hardiman(加州大学圣地亚哥分校)

  绝对定量应当利用数字PCR方法来进行,例如Bio-Rad的QX100。在缺乏数字仪器时,可以采用比较传统的方法,根据标准曲线和已知浓度的样品来确定未知浓度的样品。

  Ralph Schlapbach(瑞士联邦理工学院)

  就每个细胞中转录本拷贝的数量而言,无论是芯片,还是新一代测序,都不能提供绝对的表达水平。我们采用RSEM来计算样品中每个isoform的相对丰度。这种方法假定每个细胞中RNA的总量是恒定的,或RNA拷贝总量的变化不相关。如果这些假设不成立,那么我们建议与额外的加标(spike- in)一起测序,以控制起始材料的量。

  Q6:您如何确认您的发现?

  Gary Hardiman(加州大学圣地亚哥分校)

  来自RNA-seq和芯片的表达数据可通过qPCR来确认。

  Craig Praul(宾夕法尼亚州立大学)

  我认为,如果研究人员仔细比较各个结果,那么他们会发现qPCR、芯片和新一代测序都得到了类似的结果。MAQC研究指出,你应当确保,在比较芯片和qPCR实验时,你在研究相同探针的表达水平。在将新一代测序结果与qPCR或芯片比较时也一样,你比较的读取应与探针覆盖的区域相同。你必须清楚,平台之间基因表达水平的差异可能仅仅在于它们测定了不同的外显子。在测定基因表达时,若未考虑剪接变体的差异表达,则会导致各平台之间某种程度的不一致。

  我建议任何人使用新一代测序或芯片来发现他们认为表达有差异的基因,并利用实时定量PCR来确认这些发现。实时定量PCR让我们能够以更加合理的成本检查更大量的样品。分析更大量的重复,将为研究人员带来更多的统计可信度。

相关文章

美政府冻结加州大学洛杉矶分校近6亿美元联邦资金

当地时间8月6日,美国加州大学洛杉矶分校表示,特朗普政府已冻结该校5.84亿美元的联邦资助资金,理由是该校在支持巴勒斯坦的抗议活动中被指容忍反犹太主义。该校校长胡里奥·弗伦克通报称,目前约5.84亿美......

驱动染色质拓扑关联结构域形成关键因素获揭示

华南农业大学教授刘柏平团队与香港科技大学讲师常富杰、华南师范大学教授罗琼团队合作,首次揭示染色质物理特性中的DNA压缩密度是驱动染色质拓扑关联结构域形成的关键因素,为理解基因组三维结构形成机理提供了全......

通过操纵光子动量,纯硅光学性能提升四个数量级

美国加州大学尔湾分校科学家领导的国际科研团队,通过操纵入射光子的动量,使纯硅从间接带隙半导体变为直接带隙半导体,其光学性能提升了4个数量级。相关论文发表于最新一期《美国化学学会·纳米》杂志。研究团队解......

稳定性与可塑性:细胞命运的“天平”

表观遗传指的是在不改变DNA序列的情况下,基因表达和生物性状的可继承变化。细胞命运决定包括细胞身份的维持和转换,这就涉及到表观遗传信息的继承性和可塑性,是生命科学领域的重点前沿方向。生命的"......

华南理工团队最新成果丰富酵母基因表达

4月30日,华南理工大学食品科学与工程学院黄明涛教授课题组对酿酒酵母中的未折叠蛋白响应元件(UPRE)进行了改造,并应用于基因表达的动态调控。该成果以“TailoredUPRE2variantsfor......

最广泛灵长类动物大脑研究结果发布

科技日报北京4月1日电 (记者张梦然)美国马萨诸塞大学阿默斯特分校生物学家领导的跨学科小组最近发表了一项史无前例的研究:调查了18种灵长类动物的基因表达与大脑进化之间的联系。研究成果发表在《......

分子细胞卓越中心揭示人线粒体tRNAt6A修饰对线粒体基因表达调控的多重作用

1月16日,中国科学院分子细胞科学卓越创新中心研究员周小龙、王恩多团队在《核酸研究》(NucleicAcidsResearch)上,发表了题为Multifacetedrolesoft6Abiogene......

北京基因组所揭示半甲基化在基因表达调控中的作用

DNA甲基化是最早发现的表观遗传标记之一,在真核细胞基因表达调控中发挥重要作用。随着DNA甲基化检测技术的进步,研究发现DNA甲基化具有完全甲基化和半甲基化两种状态,以及可以稳定遗传的半甲基化修饰。关......

分子植物卓越中心揭示细胞分裂素快速激活基因表达的分子机制

细胞分裂素(cytokinin)是一种重要的植物激素,在植物的生长发育中扮演着多种角色,包括维持分生组织、促进维管组织分化、调控叶片衰老和促进再生等。以往研究表明,细胞分裂素的信号传递类似于细菌的双组......

Science:新研究揭示短串联重复序列如何影响基因表达

几十年来,科学家们已经知道,“垃圾DNA(junkDNA)”实际上起着至关重要的作用:尽管基因组中的蛋白编码基因提供了构建蛋白的蓝图,但是基因组中的一些非编码部分,包括以前被认为是“垃圾DNA”的基因......