发布时间:2021-08-16 17:28 原文链接: 深度学习算法优化序列特异性的CtoG单碱基编辑器

  8月12日,Nature Communications发表了题为Optimization of C-to-G base editors with sequence context preference predictable by machine learning methods的研究论文,该研究由中国科学院脑科学与智能技术卓越创新中心、上海脑科学与类脑研究中心研究员孙怡迪研究组与中国农业科学院深圳农业基因组研究所研究员左二伟研究组合作完成。该研究建立了深度学习模型的算法CGBE-SMART,该方法能够准确预测新型OPTI-CGBEs的单碱基编辑效率和编辑效果。

  单碱基编辑技术是基于CRISPR/Cas系统改造发展的新型基因编辑技术,可在不引入DNA双链断裂的情况下,精确地将DNA或RNA中的一个碱基替换为另一个碱基。目前,已开发并得到广泛应用的碱基编辑器包括胞嘧啶碱基编辑器(cytosine base editor,CBE)及腺嘌呤碱基编辑器(adenine base editor,ABE),但这两种碱基编辑器只能实现将C·G碱基对替换为T·A碱基对(C→T),或将A·T替换为G·C(A→G)。因此,CBE或ABE只能修复由C>T或者A>G导致的遗传表型或疾病,而对于其他类型的单碱基突变却束手无策。2020年,科研人员在CBE的基础上,研发了能够将胞嘧啶转换为鸟嘌呤的碱基编辑器(C-to-G base editor,CGBE)。而关于CGBE编辑器的研究仍处于初步阶段,对于其特异性、保真性及编辑特点仍需要进一步研究。David Liu实验室与其合作者对CGBEs系统进行改造与升级,构建了高效的CGBEs编辑器。为能够方便科研人员的日常研究,人工智能与基因编辑结合的愈发紧密,David Liu及Hyongbum Henry Kim等实验室分别建立了可预测单碱基编辑器编辑效果的BE-Hive及DeepBE等深度学习模型。

  孙怡迪研究组与左二伟研究组通过筛选不同物种来源的UNGs、密码子优化和全基因组及转录组范围测序,获得了可进行高效C到G碱基颠换以及高保真的OPTI-CGBEs。为了方便其他研究人员选择合适的C-to-G碱基编辑器以及高效预估编辑效率,科研人员建立了预测不同C-to-G碱基编辑器编辑效果的深度学习模型CGBE-SMART(如图)。CGBE-SMART结合了神经网络及概率图模型,为每一个编辑位置独立训练一套参数来预测该位置上的编辑效率。模型使用了大小不同的卷积核,建立一组基础单元网络对编辑位置周围的碱基进行特征提取和效率预测。研究人员将不同基础单元网络的预测结果用一套习得的参数进行加权平均。模型以编辑位点附近的40bp作为输入,通过神经网络预测出guide RNA结合位置1至20的编辑效率,并进一步利用贝叶斯网络预测不同编辑结果的占比(图a)。研究人员将CGBE-SMART用在不同的CGBE编辑器的8个文库数据集上进行实验。在所有的8个数据集上,BE-SMART具有较高的预测准确性(图b)。CGBE-SMART能够准确预测C-to-G编辑效率,且与之前的预测模型相比,在预测C-to-T编辑效果中有更出色的表现。

  研究人员全面优化了CGBE碱基编辑器,获得了高编辑效率与低脱靶的OPTI-CGBEs;通过机器学习开发了CGBE-SMART深度学习模型用于预测OPTI-CGBEs编辑结果。该研究将进一步加速CGBE的应用研究。研究工作得到国家自然科学基金委员会、中国农业科学院、深圳市的资助。

图片.png

CGBE深度学习模型方法构建思路。a、CGBE-SMART深度学习模型示意图;b、CGBE-SMART预测模型的设计

相关文章

连Science编辑都帮忙“插队”,“拉索”再发重磅

两个多月前的3月29日凌晨两点,全球科学家正在狂欢,庆祝他们联手研究了一颗大质量恒星死亡瞬间产生的“史上最亮”伽马射线暴(GRB221009A)。此时,我国高海拔宇宙线观测站(“拉索”,LHAASO)......

通过计算模型预测先导编辑效率及脱靶率,拓展应用前景

CRISPR基因编辑技术自问世以来,就展现出无可比拟的优势,并深刻改变了基因编辑领域乃至整个生命科学的研究模式。近年来,基于CRISPR系统开发的先导编辑(PrimeEditing,PE)引起科学家们......

首款CRISPR基因编辑疗法距美国上市咫尺之遥

4月3日,VertexPharmaceuticals(Nasdaq:VRTX)和CRISPRTherapeutics(Nasdaq:CRSP)宣布完成了examglogeneautotemcel(ex......

中科院宁波材料所提出“化学剪刀”编辑层状材料结构策略

3月17日,中国科学院宁波材料技术与工程研究所先进能源材料工程实验室黄庆研究员等人在国际学术杂志Science上发表了题为“Chemicalscissor-mediatedstructuraledit......

科技期刊卓越行动计划人才子项目拟入选案例公示

各有关单位:按照《中国科技期刊卓越行动计划实施细则》,现对2022年度中国科技期刊卓越行动计划选育高水平办刊人才子项目-优秀主编、编辑、审稿人案例遴选汇编项目拟入选案例予以公示(详见附件)。公示期为2......

建设一流科技期刊打造一流办刊人才

科技期刊传承人类文明,荟萃科学发现,引领科技发展,直接体现国家科技竞争力和文化软实力。在建设一流科技期刊的背景下,打造科技期刊专业人才队伍的重要性与日俱增。8月26日,作为第十七届中国科技期刊发展论坛......

天津工生所在维生素工业菌种基因编辑方面取得进展

苜蓿中华根瘤菌含有维生素B12的全部合成基因,可以高效合成维生素B12,但其同源重组效率低,缺乏有效的基因编辑工具,严重限制了菌种的改造。因此,亟需在苜蓿中华根瘤菌中建立高效的基因编辑工具。中国科学院......

中外联合项目助力英文期刊编辑人才培养

中国高校科技期刊研究会近日与国际出版机构施普林格·自然中国办公室联合,设立了“英文编辑及国际交流人才培养基金研究项目”。该项目旨在推动中国高校科技期刊英文编辑开展相关研究,强化国际交流和科研创新能力,......

流程化、更高效的基因编辑工具:打开肠道微生物组“窗口”

基因,就像是指挥官手里拿着的建筑总图纸,调控着生物体的一切生命活动。这份施工的图纸决定了整个建筑的所有呈现形式。那怎么才能对“图纸”——基因进行编辑呢?CRISPR/Cas编辑系统被认为是最佳的一种工......

基因编辑的精准“剪刀”

在中国科学院干细胞与再生医学创新研究院一楼科普平台里,展示着几项最新研究成果。在干细胞药物、再生医学、解密衰老等项目中,几个小试剂盒显得有些单薄,却有重要的价值和意义。“这是一种能够快速检测新冠病毒的......