超高速测序推动基因组诊断快速发展

简化的DNA和RNA测序工作流正在帮助临床医生在几天甚至几小时内提供迅速的有针对性的护理


有时好消息来得太晚。大约十年前,澳大利亚墨尔本的默多克儿童研究所的临床遗传学家Zornitza Stark及其同事开始研究基因组测序如何改善疑似遗传病的幼儿护理。研究人员对80名婴儿的基因组中的蛋白质编码区进行了测序,寻找能够解释其病症的遗传变异。对于一个有着严重神经症状的九个月大的男孩,Stark的团队锁定了一种导致关键性维生素B1缺乏的突变,这可以通过每年不到150澳元(当时为136美元)的补充剂治疗。

不幸的是,从采样到得到答案花了六个月的时间。维生素B1治疗确保了男孩的生存,但在此期间他的状况恶化,导致他终身残疾。Stark表示:“即使是两三周的周转时间,显然仍然不足以干预许多这类疾病。”“我非常渴望使其更加迅速。”

image.png

今天,该方法的确快得多。Stark和世界各地的其他人已经反复证明了快速测序和解释流程的可行性和临床效益,以提供及时的、个性化的干预措施,用于之前难以解释的疾病。这些工作流程通常可以在一周内提供诊断结果,但由斯坦福大学的基因组研究员Euan Ashley及其同事保持的基因组测序诊断记录是略超过七小时。在肿瘤学中,当需要超快速的反应时,这些工作流程甚至帮助临床医生在不到一小时内对肿瘤进行分类和制定治疗计划。[1]

基于测序的诊断对一些临床医生来说可能很难接受,尤其是那些倾向于采取保守方法的医生——而且在十年前左右,基因组分析是缓慢、昂贵且不太可能提供切实可行的结果。但怀疑者们正逐渐改变看法。荷兰乌得勒支大学医学中心的生物信息学家Jeroen de Ridder表示:“当我与临床合作者交谈时,他们总是以‘啊,我们不需要它’开始。”“但是,当你启用它并使其成为可能时,突然间他们开始看到以前看不到的机会。”[2]

技术进展得如此之快,以至于即使是早期采用者也可能难以跟上。圣地亚哥加利福尼亚州的雷迪儿童基因医学研究所的快速测序先驱Stephen Kingsmore表示:“大约每18个月,我们都会经历一次技术革命——不是演变,是革命。”“我们现在正处于其中。”

突破瓶颈

基因诊断试验已经指导临床医生几十年了。早期的测试重点放在与疾病有已知关联的基因上,例如乳腺癌风险因子基因BRCA1。然而,随着测序成本的降低,整个基因组测试越来越受欢迎,用于诊断癌症或罕见的遗传性疾病。然而,这一过程进行得很慢。“临床基因测试的一切都没有速度的考虑,”Ashley说。

测序数十亿个核苷酸,以足够的“冗余”确保高精度结果需要时间,而检查结果以识别潜在相关序列异常则需要更长时间。即使是更为有针对性的“外显子”分析,它关注的是包含蛋白质编码基因的基因组的1-2%,也需要几个月的时间来提供答案。

Kingsmore将他的首次加速该过程的尝试描述为“侥幸”。2012年,圣地亚哥的测序公司Illumina联系到当时他所在的机构——密苏里州堪萨斯城的儿童慈善医院,以测试其新的“快速运行模式”。Illumina是短读取测序的市场领导者,该过程产生数十亿个100-200核苷酸的DNA序列“读数”,然后可以通过计算重新组装成整个基因组或外显子。这种模式结合了测序化学和分析的进展,使测序步骤从约10天减少到1天。Kingsmore和他的同事建立了一个围绕新模式的诊断工作流程,允许他们在采集血样后的50小时内确定新生儿的可能致病突变。[3]

“我们解码基因组的前四例中有三例发现了结果,就像炸弹爆炸了一样,”Kingsmore说。从那以后,他一直在完善这个过程,发表了数十篇研究论文,并协调了一个名为Baby Bear的试验,该试验在2018年至2020年间在加利福尼亚的5家医院中展示了实施这种诊断工作流程的可行性,涉及近200名婴儿。他估计,每年有数千名美国儿童接受这项服务。

其他团队也开发了类似的项目。Stark的团队正在协调澳大利亚所有医院的婴儿和儿童急救基因组计划,而阿联酋迪拜的Al Jalila儿童专科医院的临床遗传学家Ahmad Abou Tayoun正带领Little Falcon计划,为200个中东家庭的危重病婴进行快速测序。在英国,埃克塞特大学的临床遗传学家Emma Baple正在协调英格兰和联合王国其他地区每年为1200个家庭提供快速测序的国民健康服务计划。

image.png

Ultra-rapid sequencing of human genomes can identify rare diseases and speed up treatment. Credit: Jean-Philippe Ksiazek/AFP/Getty

为了实现这些加速的工作流程,临床基因组团队已经找到了多个简化过程的机会。首先,他们基本上取消了外显子测序,这需要额外的样本准备步骤并且牺牲了有价值的信息。“自从我们转向全基因组测序以来,我们捕获了大约3-4%的诊断结果,这些结果在外显子测序中是无法检测到的,”Baple说。这包括位于影响基因表达和调控的编码区域之外的关键突变。

测序仪器也变得更快了。许多实验室使用Illumina的最先进的NovaSeq X Plus,它每天可以产生数万亿个核苷酸的测序数据。但这可能会很昂贵——这种高通量系统的经济优势在一次处理多个样本时才会显现。但大多数快速测序样本代表紧急的个体病例,因此进行测序的成本与在更高效的工作流程中处理数十个基因组的成本一样高。

无论采用哪种工作流程,这些快速测序项目都取得了非常一致的成功,通常在40-50%的病例中提供了自信的诊断,其中许多可以通过医学手段解决。解释仍然可能是具有挑战性的,但由于通过英国生物库计划和基因组聚合数据库等倡议收集的数百万个临床注释的基因组和外显子,这也变得更加容易。

另一个有助于的因素是不断发展的计算工具。初步的基因组处理和分析现在可以使用基于云的资源进行,这样可以避免研究人员使用昂贵的高性能计算机。而软件包也已经发展到可以自动化关键的分析步骤。Kingsmore和Abou Tayoun都在使用Illumina的DRAGEN工具包,以快速收敛到相关的序列和结构变异,例如。还有一些有用的资源,如GeneMatcher,这是一个在线服务,帮助世界各地的遗传学家和临床医生交换有关与疾病相关的突变的见解。在使用GeneMatcher帮助诊断一名年轻患者的几分钟内,Baple的团队就与其他患有一种叫做扩张型心肌病的心脏病的儿童的相似突变的报告联系上了。“扩张型心肌病的记录意味着孩子在足够大的时候有可能进入移植名单,”她说。

然后是人工智能(AI)的承诺。Abou Tayoun估计,遗传学家和其他专业人员在首次诊断交付之前大约需要一个小时来手动审查每个基因组。但是AI的能力正在成熟,Kingsmore预测这种技术将很快产生重大影响。AI系统“确实会错过一些事情,他们确实会犯错误,但你现在可以在10分钟内对基因组进行解释,”他说。与此同时,“我们仍然需要大量的人力参与”。

展望长远

Illumina仍然是全球几乎所有临床测序项目的支柱,但它面临着许多竞争对手。尽管这些平台仍然太新,没有实质性的临床记录,但它们可能使无法负担NovaSeq X Plus的单一样本分析的用户能够使用高于100万美元的价格标签。

Kingsmore对来自圣地亚哥的Element Biosciences的AVITI仪器特别感兴趣。该仪器设计用于中等吞吐量,并且具有公司声称与或优于Illumina的基础准确性的每碱基准确度。“你购买三台仪器——而且这些仪器相对便宜,每台约25万美元——你就能得到200美元的基因组,”他说。相比之下,仅仅十年前对整个基因组进行测序的成本大约是10000美元。“这将是非常具有变革性的。”

但也许最令人兴奋的是“长读取”技术,特别是由英国公司Oxford Nanopore Technologies(ONT)开发的技术。长读取对于记录基因复制、缺失和其他短读取方法难以捕捉的结构变化非常有价值。重要的是,当需要超快速的响应时,这项技术还可以用于检测其他“组学”指标,比如癌症(见“几分钟的事情”)。

几分钟的事情

超快速测序也可以指导高效的癌症管理。

尽管主要是用于DNA测序的工具,由英国公司Oxford Nanopore Technologies(ONT)开发的平台可以提取其他类型的分子信息,包括基因表达模式和染色体DNA的表观遗传修饰。这些数据可以帮助临床医生加速癌症诊断,使关键的治疗决策在几小时内执行而不是花费数周。

例如,儿童脑瘤可能以多种形式表现,其中一些比其他形式更具侵略性且难以治疗。荷兰乌得勒支大学医学中心的生物信息学家Jeroen de Ridder表示:“对于外科医生来说,问题是,我要多么积极地进行手术?”“我要全力以赴并冒一些风险,还是我可以更保守一些?”DNA序列数据可以帮助对这些肿瘤进行分类,但是表观基因组标记——特别是DNA甲基化模式——更具信息量,加利福尼亚州圣地亚哥Rady儿童基因医学研究所的快速测序先驱Stephen Kingsmore表示。

de Ridder领导的团队开发了一个名为Sturgeon的深度学习算法,研究人员使用了从患者DNA甲基化谱中导出的数百万个模拟数据集进行训练。去年,该团队报告说,Sturgeon在仅40分钟的时间内在ONT MinION设备上测序了50个肿瘤样本中的45个,这足够让临床医生在活检过程中患者仍处于麻醉状态时做出治疗决策,并在有需要时直接进行侵袭性手术。该团队还在真实的术中环境中测试了这种方法。de Ridder表示,类似的方法可能对其他异质性肿瘤类型,包括软组织肉瘤,也很有用。

科学家们还在开发基于测序的“液体活检”方法,其中通过检测血液和尿液等体液,可以快速检测、监测和评估癌症的治疗反应。悉尼澳大利亚新南威尔士大学的计算生物学家Martin Smith领导的团队表明,使用MinION进行血样的RNA测序可以将白血病样本的分类时间从几天缩短到几分钟。“对于大多数样本,5分钟足以使其在90%以上的分类——这只需要30,000个读数,”Smith说。该算法可以在标准笔记本电脑上区分急性淋巴细胞白血病的11个亚型,Smith表示类似的方法也可以应用于其他时间关键的疾病,包括败血症、感染和自身免疫疾病的爆发。[4]

image.png

Infants with unknown conditions can benefit from fast diagnoses enabled by rapid sequencing.Credit: Elisabeth Schneider/Look at Sciences/Science Photo Library

系统重启

但是在临床诊断方面,技术只是战斗的一半,还有人为和后勤方面的问题要解决。“瓶颈实际上是让医生熟悉它的可用性以及何时订购它,”Abou Tayoun说。“当然,确保他们得到结果后能够采取行动也很重要。”

这包括解决各种其他细节,包括速度和成本之间的最佳平衡;以及在不到一天的时间内提供诊断是否相对于三到五天的时间显著改善了结果。对于患有严重呼吸、心脏或肝脏问题的危重新生儿,紧急情况很高,但除了测序本身之外还有其他考虑因素。“加速测试在10小时内完成或其他时间内完成都很好,但如果儿童甚至需要3周才能接受测试,你就不会真正获得全部好处,”Stark说。

公平获得仍然是一个严重的问题。将数据分析移到云端可以减轻医院的计算负担。但是如果没有测序设备和熟练的用户在现场,资源有限的医疗设施可能不得不将样本送到中央实验室,引入延迟和后勤障碍。Ashley表示,这可能使价格合理且便携的ONT仪器具有优势,特别是在资源有限的偏远社区或有限实验室资源的低收入和中等收入国家。

随着快速测序工作流的成熟,这些问题应该会得到解决。而且能从中受益的人群庞大。Kingsmore现在正在将他的团队的快速基因组测序应用于对近400种遗传病筛查数万名新生儿的研究中,这被称为BeginNGS。他说,这个项目在一定程度上是新技术的试验场,以加强这一过程,包括目前提供了大约90%的诊断准确性的人工智能引导工具。但更一般地说,这是为了铺平道路,让任何人都能从快速、准确的测序中受益。

“我们需要在每年数百万个样本上进行的一项工作,成本不到1,000美元,甚至可能不到500美元,”Kingsmore说。“我们必须考虑完全不同规模的自动化。”

References

  1. Gorzynski, J. E. et al. N. Engl. J. Med. 386, 700–702 (2022).

    Article PubMed Google Scholar 

  2. Vermeulen, C. et al. Nature 622, 842–849 (2023).

    Article PubMed Google Scholar 

  3. Saunders, C. J. et al. Sci. Transl. Med. 4, 154ra135 (2012).

    Article PubMed Google Scholar 

  4. Goenka, S. D. et al. Nature Biotechnol. 40, 1035–1041 (2022).

    Article PubMed Google Scholar 

  5. Sagniez, M. et al. Preprint at medRxiv https://doi.org/10.1101/2022.06.22.22276550 (2022).


相关文章

Nature最新文章:基因测序游戏规则正在被改写,速度翻倍,仅需数小时

超高速测序推动基因组诊断快速发展简化的DNA和RNA测序工作流正在帮助临床医生在几天甚至几小时内提供迅速的有针对性的护理有时好消息来得太晚。大约十年前,澳大利亚墨尔本的默多克儿童研究所的临床遗传学家Z......

Nature最新文章:基因测序游戏规则正在被改写,速度翻倍,仅需数小时

超高速测序推动基因组诊断快速发展简化的DNA和RNA测序工作流正在帮助临床医生在几天甚至几小时内提供迅速的有针对性的护理有时好消息来得太晚。大约十年前,澳大利亚墨尔本的默多克儿童研究所的临床遗传学家Z......

Nature最新文章:基因测序游戏规则正在被改写,速度翻倍,仅需数小时

超高速测序推动基因组诊断快速发展简化的DNA和RNA测序工作流正在帮助临床医生在几天甚至几小时内提供迅速的有针对性的护理有时好消息来得太晚。大约十年前,澳大利亚墨尔本的默多克儿童研究所的临床遗传学家Z......

Nature发布2024年值得关注的七大技术,首位中国科学家成果入选

2024年1月22日,《自然》发布了2024年值得关注的七大技术——大片段DNA插入、人工智能设计蛋白质、脑机接口、细胞图谱、超高分辨率显微成像、3D打印纳米材料和DeepFake检测。七大技术中,生......

古DNA研究对东亚豹母系遗传历史提出新见解

1月15日,中国科学院古脊椎动物与古人类研究所、西北大学和湖南省文物考古研究院共同主导完成的题为《古DNA准确鉴定湖南老司城遗址残缺头骨以及东亚豹母系遗传历史新见解》(AncientDNAunrave......

真还是假?2023年度十大科学流言揭晓

1月21日,“智止流言探求真知——2023年度‘科学’流言求真榜”在北京揭晓。具体包括,基因检测能“剧透”孩子天赋;中国科学家测定月球年龄为20.3亿年;航天员不能是近视眼,因为太空中不能戴眼镜;电水......

最大的海洋微生物基因数据库有助于药物发现

迄今对包括细菌、病毒和真菌在内的海洋微生物基因进行的最全面分析,可为研究人员发现抗生素、追踪气候变化影响和保护濒危物种奠定基础。1月16日,相关成果发表于《科学前沿》。据《自然》报道,2021年,研究......

再谱篇章!脑科学领域首座DCSLab落成

日前,华大智造宣布脑科学领域首座DCSLab在上海脑科学与类脑研究中心(以下简称“上海脑中心”)正式落成。华大智造先进的生命科技工具将全面助力上海脑中心引领神经科学基础研究,为构建以上海为核心、协同长......

全球最大古人类基因库创建,基因和疾病历史传播情况绘成

1月11日,大型国际专家团队分析了34000年前生活在西欧和亚洲的近5000名人类的骨骼和牙齿化石,创建出世界上最大的古人类基因库。通过对古人类DNA进行测序并将其与现代样本进行比较,团队绘制了基因和......

癌症“照妖镜”——游离DNA助力肿瘤早期探查

“人体细胞也有生命周期。细胞衰老凋亡后,细胞内的物质会渗透出来。其中,DNA会随之‘崩裂降解’,进入血液,成为游离DNA。”中国医学科学院肿瘤医院防癌科副主任张凯教授告诉科技日报记者,“肿瘤细胞的游离......