发布时间:2024-05-05 15:54 原文链接: 人工智能设计的基因编辑工具来了

在不断探索以前未知的CRISPR基因编辑系统的过程中,研究人员从温泉、泥炭沼泽、粪便甚至酸奶中搜寻各种微生物。现在,由于生成式人工智能的进步,他们可能只需按一下按钮就可以设计出这些系统。

据《自然》报道,日前,研究人员公布了他们如何使用一种名为蛋白质语言模型的生成式人工智能工具设计CRISPR基因编辑蛋白质的细节,并证明其中一些系统如预期那样工作。 

今年2月,另一个团队宣布,他们已经开发出了一种基于微生物基因组的模型,并用它来设计新的CRISPR系统,该系统由DNA或RNA切割酶和RNA分子组成。

“这真的只是皮毛而已。这表明,用机器学习模型设计这些复杂系统是可能的。”机器学习科学家、美国生物技术公司Profluent首席执行官Ali Madani说。4月22日,Madani团队在预印本服务器bioRxiv上公布了一篇尚未经过同行评审的论文,报告了他们所说的“首次完全利用机器学习设计的蛋白质成功编辑人类基因组”。

中国香港大学合成生物学家Alan Wong表示,自然产生的基因编辑系统在它们可以靶向的序列以及可以做出的改变方面存在局限性。因此,对于某些应用来说,找到合适的CRISPR可能是一个挑战。“利用人工智能扩大编辑的范围可能会有所帮助。”他说。

尽管像ChatGPT这样的聊天机器人是以现有文本进行训练后处理语言的,但CRISPR设计人工智能是在大量生物数据上进行训练的,这些数据是蛋白质或基因组序列形式的。这一“预训练”步骤的目标是让模型深入了解自然发生的遗传序列,比如哪些氨基酸倾向于组合在一起。然后,这些信息可以应用于创建全新序列之类的任务。

Madani团队此前曾使用他们开发的蛋白质语言模型ProGen来开发新的抗菌蛋白。为了设计新的CRISPR,该团队用数百万种不同的CRISPR系统重新训练了一个更新版本的ProGen。

由于CRISPR基因编辑系统不仅包括蛋白质,还包括指定其靶点的RNA分子,Madani团队开发了另一个人工智能模型来设计这些“引导RNA”。

然后,该团队使用神经网络设计了数百万个新的CRISPR蛋白序列,这些序列属于自然界中发现的数十个不同的此类蛋白质家族。

为验证人工智能设计的CRISPR是否是真正的基因编辑器,Madani团队合成了与CRISPR-Cas9系统中200多种蛋白质设计相对应的DNA序列。

当研究人员将这些序列——Cas9蛋白和“引导RNA”——插入人类细胞时,许多基因编辑器能够精确地切割基因组中的预期靶点。

最有前景的Cas9蛋白——一种名为OpenCRISPR-1的分子,在切割靶向DNA序列方面与广泛使用的细菌CRISPR-Cas9酶一样有效,而且它在错误的地方切割的次数要少得多。研究人员还使用OpenCRISPR-1设计创建了一个碱基编辑器——这是一种精确的基因编辑工具,可以改变单个DNA的“字母”,发现它也与其他碱基编辑系统一样高效,而且不太容易出错。

另一个团队由美国斯坦福大学计算生物学家Brian Hie和美国Arc研究所生物工程师Patrick Hsu领导,他们使用了一种能够生成蛋白质和RNA序列的人工智能模型。这个名为EVO的模型在来自细菌和古细菌以及其他微生物序列的8万个基因组上进行了训练,总计有3000亿个DNA碱基。Hie和Hsu的团队尚未在实验室测试其设计。但他们预测,该团队设计的一些CRISPR–Cas9系统的结构与天然蛋白质的结构相似。这项工作也在预印本服务器bioRxiv上公布。 

西班牙巴塞罗那分子生物学研究所的计算生物学家Noelia Ferruz Capapey说:“这太神奇了。”与一些获得专利的基因编辑工具不同,研究人员可以无限制地使用OpenCRISPR-1分子,这给她留下了深刻印象。 

Madani说,希望人工智能设计的基因编辑工具比现有的CRISPR更适合医学应用。他补充说,Profluent希望与开发基因编辑疗法的公司合作,以测试人工智能生成的CRISPR。

相关论文信息:https://doi.org/10.1101/2024.04.22.590591

 https://doi.org/10.1101/2024.02.27.582234 


相关文章

胚胎“体检”狙击遗传肿瘤10年诞生百名“无癌宝宝”

11月1日,在长沙举行的第五届湖南省抗癌协会家族遗传性肿瘤专业委员会学术年会上,中信湘雅生殖与遗传专科医院(下称中信湘雅)首席科学家卢光琇宣布,该院第100位通过胚胎植入前遗传学检测(PGT)技术阻断......

我国科研人员找到导致反复“试管”失败的“基因钥匙”

10月16日,记者从中信湘雅生殖与遗传专科医院获悉,该院研究员林戈、副研究员郑伟团队,联合山东大学、上海交通大学医学院等单位的科研团队开展合作攻关,系统揭示了卵子与早期胚胎质量问题导致女性反复“试管”......

衰老如何改变我们的基因

衰老对身体产生的可见影响有时与基因活动的无形变化有关。DNA甲基化的表观遗传过程会随着年龄增长而变得不再精确,造成基因表达的变化。而这种变化与随着年龄增长而出现的器官功能衰退和疾病易感性增加有关。如今......

为何有人衰老更快?揭秘背后的400个基因

有些人比同龄人更显年轻,而有些人看着更显老;有些人年逾九旬仍身心康健,而另一些人早在数十年前就饱受糖尿病、阿尔茨海默病或行动障碍的困扰;有些人能轻松应对严重摔伤或流感侵袭,而有些人一旦住院就再难康复。......

科学家开发出超大片段DNA精准无痕编辑新方法

基因组编辑技术作为生命科学领域的一项重要突破,为基础研究和应用开发提供了技术支撑。以CRISPR及其衍生技术为代表的编辑系统通过可编程的向导RNA引导Cas9等核酸酶靶向基因组特定位点,被广泛应用于特......

科学家发现玉米耐热关键基因

近日,西北农林科技大学玉米生物学与遗传育种团队联合华中农业大学玉米团队在《植物生理学研究》发表论文。研究初步揭示了ZmGBF1-ZmATG8c模块通过自噬途径调控玉米耐热性的分子机制。随着全球气温持续......

降本提效!我团队研制出系列牛用基因芯片

记者21日从国家乳业技术创新中心获悉,该中心技术研发团队成功研制出奶牛种用胚胎基因组遗传评估芯片和“高产、抗病、长生产期”功能强化基因组预测芯片。该系列基因芯片具有完全自主知识产权,填补了我国基因芯片......

新研究:阻断或抑制一种特殊基因可选择性杀伤癌细胞

国际期刊《内分泌学前沿》日前刊登的一项新研究揭示,一种特殊基因对肠道吸收维生素D及其后续代谢过程至关重要,阻断或抑制该基因能够选择性抑制癌细胞生长。这一发现在癌症治疗等精准医学领域具有广阔应用前景。维......

我国科学家发现大豆种子油蛋比调控关键基因

记者从安徽农业大学获悉,该校王晓波教授团队联合中国农业科学院作物科学研究所邱丽娟、李英慧研究员团队,解析了关键基因对大豆种子油脂和蛋白比例(油蛋比)的调控机制,为高油或高蛋白大豆品种选育提供了新方向。......

茶叶大小谁定?这个基因很关键

茶树是以收获新梢为主的叶用经济作物,茶芽大小不仅直接影响鲜叶的产量和品质,还与茶类适制性密切相关。解析茶树芽大小的遗传调控机制,有助于改良茶树品种、提高茶叶产量。近日,中国农业科学院茶叶研究所种质资源......