斯坦福大学医学院的遗传学教授Michael Snyder及其同事利用Pacific Biosciences系统,对三个家庭成员的类淋巴母细胞转录组进行了测序,并将获得的reads与Illumina平台上获得的较短reads进行比较。通过这些转录组,他们开发出一名家庭成员的等位基因特异的全长转录组。
斯坦福大学的研究人员利用一种基于long-read的方法,生成了个人的转录组。这项成果于近日发表在《美国国家科学院院刊》上。
文章的通讯作者是斯坦福大学医学院的遗传学教授Michael
Snyder。他的实验室主要利用各种方法来分析基因组及调控网络。他们的研究对象包括酵母和人类。Snyder教授曾在《Cell》、《Science》、《Nature》等杂志上发表了多篇具有影响力的文章。
在这项研究中,Snyder及其同事利用Pacific
Biosciences系统,对三个家庭成员的类淋巴母细胞转录组进行了测序,并将获得的reads与Illumina平台上获得的较短reads进行比较。通过这些转录组,他们开发出一名家庭成员的等位基因特异的全长转录组。他们能够区分两个等位基因,即使是复杂的基因如HLA。
研究人员在文章中写道:“据我们所知,我们生成了最深且最长的单分子long-read数据集。”他们认为,这种个人的转录组,将对了解个体生物学和疾病很重要。
Snyder及其同事利用PacBio平台,对GM12878细胞系的大约711,000个环化一致分子(circular
consensus read molecules)进行测序。他们产生了较长的reads(平均读长为1,188
bp),这比去年他们在《Nature Biotechnology》上展示的人体器官panel的数据集更长(平均读长为999.9 bp)。
他们也指出,尽管两个数据集都同样产生了较短的分子(长度介于0.8 kb和1.3 kb),但是现有的数据集更好地代表了长于1.7 kb的分子。
此外,这个斯坦福的团队也在Illumina的平台上对100 M个101 bp的双端reads进行测序,并利用Cufflinks开展分析。
这两种技术都发现了约99,000个带注释的外显子-外显子接头,且Illumina的reads发现了额外92,000个注释接头,而PacBio的reads发现了额外992个。此外,对于22,600个被Gencode归为蛋白编码基因或lincRNA的剪接基因,long-read的单分子测序和101
bp的双端测序同时鉴定出其中的9,200个。long-read还发现了40个基因,双端测序发现了6,400个基因,而还有7,000个基因利用两种方法都未发现。
研究人员推测,由于环状一致read的产生需要读长至少是cDNA长度的两倍,故consensus split-mapped molecules(CSMM)不包含大量较长的基因。
研究人员表示,转录组学研究的目标是能够指定表达RNA分子的等位基因。他们认为,long-read测序应该能够确定影响单个RNA分子的每个SNV。
为了追踪在GM12878子细胞系中发现的这些等位基因的来源,他们合并了GM12891和GM12892母细胞系的数据,并研究了子代中存在的SNV是否存在于亲代数据中。
通过主成分分析,他们能够分离出两个等位基因。对于166个注释有两个杂合SNP的基因,研究人员发现其中的158个有两个或以上的SNP,2个基因有一个SNP,而6个基因似乎不是杂合的。
一些基因,尤其是HLA基因,包含多个SNP,而对于它们,研究人员基本能够确定相位。“即使是复杂的基因(如HLA基因,其序列可能与参考序列相差甚远),两个等位基因通常也是清晰可辨的,”Snyder及其同事写道。
原文检索
Defining a personal, allele-specific, and single-molecule long-read transcriptome
Published online before print June 24, 2014, doi: 10.1073/pnas.1400447111 PNAS June 24, 2014
近日,中国科学院北京基因组研究所(国家生物信息中心)高远团队与动物研究所赵方庆团队,开发出面向TB级转录组数据的高效环形RNA检测与定量工具CIRI3,通过反向剪接序列比对与跨样本整合算法设计,实现了......
图转录组光催化标记技术CAT-seq及同步多组学光催化标记技术CAT-ortho在国家自然科学基金项目(批准号:22222701、92478119、22321005、92253301)等资助下,北京大......
7月11日,由临港实验室牵头,联合上海科学智能研究院、上海交通大学、东京大学国际神经智能研究中心等多家单位,共同发布了全球首个跨物种大脑空间转录组基础模型BrainBeacon。生命科学中的细胞“语言......
7月11日,由临港实验室牵头,联合上海科学智能研究院、上海交通大学、东京大学国际神经智能研究中心等多家单位,共同发布了全球首个跨物种大脑空间转录组基础模型BrainBeacon。生命科学中的细胞“语言......
近日,中国农业科学院生物技术研究所玉米功能基因组创新团队首次在单细胞水平解析了玉米根系细胞对热胁迫的特异性响应机制,揭示了热胁迫下植物根系的细胞异质性、根系类型的差异和分化轨迹,鉴定了单双子叶植物响应......
通过转录组测序获得人的基因表达谱数据,能进一步挖掘疾病相关的生物标志物,为临床诊断提供依据。目前,由于转录组测序无法溯源,导致不同实验室及测序平台产出的数据可比性和测序结果的准确性面临挑战。中国计量科......
冠状动脉旁路移植术(CABG)又被称为冠状动脉搭桥术,是改善心脏自身血供的手术,可以有效治疗冠心病导致的心肌缺血。该手术从患者身上取下一段健康的血管供体,一端与升主动脉相连,另一端与冠状动脉堵塞部位的......
图SEVtras高效识别单细胞转录组数据中的胞外小囊泡在国家自然科学基金项目(批准号:32025009、32130020等)资助下,中国科学院北京生命科学研究院赵方庆团队在单细胞数据挖掘算法方面取得新......
近日,湖北宜万医疗用品有限公司中标武汉大学流式分析系统采购项目,总中标金额2863.33万元。详细内容如下:公告信息:采购项目名称武汉大学流式分析系统采购项目品目货物/专用设备/医疗设备/临床检验设备......
近日,广东省科学院南繁种业研究所玉米种业室团队以甜玉米为研究对象,对甜玉米高温下的表型特征变化进行观察,发现了提高鲜食玉米耐热性基因。相关研究论文发表于InternationalJournalofMo......