发布时间:2015-11-20 00:00 原文链接: 新一代测序十年记:后起之秀PacBio

  在新一代测序技术崛起的早期,市场主要被Illumina、Life Tech和Roche这三家公司占领。偶尔也有一些新的测序平台出现,但大多是雷声大雨点小,不久便没了下文。面对这些强大、成熟的系统,新平台要想站稳脚跟,的确不是件容易的事。

  在2010年的AGBT年会上,Pacific Biosciences的测序仪吸引了众人的注意。这台名为PacBio RS的测序仪被称为第三代测序平台,而有别于之前推出的二代测序平台。至于什么是第三代测序,PacBio当时的CEO Hugh Martin是这样解释的,“它就是在第二代测序(通量、成本)的基础上添加非常长的读长、极低的试剂成本,以及快速的运行时间”。

  的确,PacBio RS系统有着其他系统无可比拟的读长,超过1000个碱基。这是因为PacBio的单分子实时(SMRT)测序反应是最接近天然状态的聚合酶反应体系,最大限度地保持了聚合酶的活性。此外,样品制备非常快速,只需要4-6小时,而不是几天。制备过程不需要PCR,从而减少了错误和偏向。从样本制备到测序,所需的时间还不到一天。

  对于重测序而言,短读长也许不是大问题,但是对于de novo测序,这可让人们吃尽苦头。例如,韩国极地研究所的Hyun Park在测序一种GC含量高达71%的极地微生物时发现,即使利用Illumina平台进行200X深度测序,仍无法获得完整的基因组图。组装时产生了185 个Contig,而且缺口数量太多,根本无法通过Sanger法有效补齐。他们只好求助于PacBio,而后仅用15X覆盖度就能组装得到26个Contig,最终获得了完整的基因组信息。

  随后,《Nature Methods》上发表的一篇文章又再次让PacBio成为关注的焦点。研究人员利用SMRT技术,直接测定了DNA的甲基化,这是二代测序技术无法实现的,因为它们在测序前需要PCR扩增,一扩增这些修饰标记就被置换而消失殆尽了。SMRT技术利用DNA聚合酶的动力学特征,对碱基掺入时产生的停顿间隔脉冲信号足够敏感,可区分12种以上不同类型的碱基修饰。这些信息也帮助解析了欧洲大肠杆菌疫情的元凶E. coli O104:H4。

  然而,PacBio也受到高错误率的困扰。人们一听到85-87%的原始准确性就吓坏了。虽然PacBio也澄清,这是由于在测序过程中单个分子信号弱,偶尔会出现信号难于分辨的情况。出错几率是随机的,与序列长度、序列组成无关。只要提高循环次数,就能够提高准确率。不过,PacBio的业务还是一度陷入低迷,股价在1块多徘徊。

  2012年,事情开始出现转机。冷泉港实验室的Michael Schatz开发了一种纠错算法,用二代测序的短读长高精确数据对三代长读长数据进行纠错,这种称为“混合纠错拼接”的算法发表在7月的《Nature Biotechnology》上。通过混合纠错法,他们发现“数据几近完美”。

  这种方法融合了二代测序和三代测序的优势。“对于短读长,哪怕无限制地提高覆盖度,也不能解决复杂区域的测序问题。但长读长可以跨越这次复杂区域,因此不需要太高的覆盖度就可以对付。同理,长读长也可以用于检测并鉴定单倍体型和转录本的可变剪切,”Schatz谈道。

  第二年,PacBio发布了新版本的测序仪 C PacBio RS II,平均读长达5,000 bp,最长读长超过20,000 bp,且通量较之前的版本增加一倍。随着硬件和软件的不断升级,订单数量也开始增加。到2013年底,PacBio更与Roche合作,联手打造一款临床测序产品。此后,引用PacBio系统的研究成果不断在各种刊物上发表。

  Illumina超高通量测序平台HiSeq X Ten的上市也为PacBio带来了新订单。韩国公司Macrogen和J. Craig Venter的Human Longevity在安装了HiSeq X Ten系统之后都购买了两台PacBio RS II系统。他们在开展大规模人类基因组测序研究时,希望利用PacBio的长读长来弄清结构变异及其他复杂区域。

  至此,PacBio完成了一次漂亮的逆袭。它凭借自身的独特优势,在竞争激烈的新一代测序市场上站稳脚跟,并带来丰硕的研究成果。当然,仪器仍在不断升级。最新型号的Sequel测序仪将在明年上市。

相关文章

“女娲”基因组计划发布第五项成果

近日,“女娲”基因组团队重点阐释了适应性选择下非编码调控元件对表型演化的影响,相关研究发表于《分子生物学与进化》。这项工作是中国科学院生物物理研究所徐涛院士、何顺民研究员牵头的“女娲”(NyuWa)中......

PacBio2023年收入超2亿美元增长56%,净亏损3亿

    近日,PacBio(纳斯达克股票代码:PACB)公布截至2023年12月31日的季度和财年的财务业绩。2023年收入为2.005亿美元,与去年同期的1.......

一生中患病的几率或可预测,十种慢性病遗传风险估算更接近临床

通过分析基因组中数百万个微小的遗传差异,就可预测一个人一生中患某种疾病的几率。在过去的10年中,研究人员为数十种疾病制定了风险评分,希望有一天患者能利用这些信息来降低患病风险。在《自然·医学》杂志最新......

揭秘基因组“暗物质”

记国家自然科学基金重大研究计划“基因信息传递过程中非编码RNA的调控作用机制”在人类遗传信息传递过程中,非编码RNA不参与编码蛋白质,占全部RNA的98%,如同宇宙中神秘的“暗物质”,是生命活动调控的......

构建水稻基因组倒位变异图谱

近日,中国农业科学院深圳农业基因组研究所联合国内多家单位发布了迄今为止最大的水稻群体水平倒位变异图谱,并挖掘获得了新的水稻耐热优异等位基因,该研究对水稻育种改良具有重要意义。相关研究成果发表在《科学通......

基因组精确注释新方法:增强子鉴定新技术

近日,中国农业科学院深圳农业基因组研究所动物功能基因组学创新团队研发出增强子鉴定新技术。该技术与传统技术相比,平均分辨率提高了约10倍,为基因组的精确注释提供了新方法。相关研究成果发表在《核酸研究》(......

迈向CRISPR2.0,下一代基因编辑技术方兴未艾

美国食品药品监督管理局(FDA)本月稍早时间宣布,批准CRISPR/Cas9基因编辑疗法Casgevy上市,用于治疗12岁及以上镰状细胞贫血病患者。这是FDA批准的首款CRISPR基因编辑疗法。而11......

瑞孚迪:改变千万新生命——全基因组测序在新生儿筛查中的应用

导读:这项技术可以及早发现那些可能对患儿生命产生重大影响的罕见疾病。     瑞孚迪的这项首创研究证明了全基因组测序在对看似健康的新生儿的筛查中存在重......

科学家解析百余“神奇蘑菇”基因组以培育新品种

科学家收集了几十种“神奇蘑菇”的基因组数据,以了解驯化和培养是如何改变它们的,从而培育新品种蘑菇。相关研究近日发表于《当代生物学》。裸盖菇的商业品种缺乏遗传多样性,因为它们被驯化为人类使用。而澳大利亚......

万种原生生物基因组计划取得阶段性进展

原生生物(Protist)是一大类单细胞真核生物的集合,包括单细胞真核藻类和原生动物等,组成了原生生物界。原生生物具有高度多样性,广泛分布于各类水环境中,在生态平衡、物质和能量循环、环境健康、动植物疾......