蛋白质是生命体的最主要组成元素,作为一种生物大分子机器,蛋白质功能的实现高度依赖于其复杂的三维原子结构。了解蛋白质的结构及其与功能的关系对探索生命的基本原理,理解疾病的分子机制以及药物的研发具有重要的意义。

基于粒子滤波的三维重构算法示意图。

  冷冻电子显微镜,简称冷冻电镜,使用电子束作为光源,是一种能在原子分辨率水平上观察并测定蛋白质分子结构的有力工具。伴随着最近几年的技术突破,冷冻电镜三维重构技术成为测定蛋白质及其复合物结构的关键技术。冷冻电镜三维重构的基本方法是,首先利用冷冻电镜对冷冻于液氮温度的生物大分子颗粒进行成像,以获得数万到数百万张生物大分子照片,然后通过一定的算法来整合这些图像,计算出生物大分子的三维结构。这其中三维重构算法是核心内容,用于测定出每一张照片的诸多参数,例如空间取向,然后才能将二维的照片整合重构出三维的结构。因为照片的数量巨大,且图像信号极其微弱,如何精确计算测定每张照片的参数,以达到超过0.4甚至0.2纳米的分辨率,一直以来都是冷冻电镜技术研究的重点和难点。

  来自清华大学生命科学学院的研究人员发表了题为“A particle-filter framework for robust cryoEM 3D reconstruction”的文章,介绍了一种基于粒子滤波的鲁棒的冷冻电镜三维重构算法框架,这种方法通过将电子工程应用中的粒子滤波算法引入到冷冻电镜三维重构中,大幅提高了对系统参数的搜索能力和对系统误差的容忍度;通过进一步融合高性能计算的方法,最终实现了对生物大分子结构高效高精度的三维重构。

  这一发现公布在11月30日的Nature Methods杂志上,由清华大学生命科学学院李雪明研究组,电子工程系沈渊研究组和计算机系杨广文研究组合作完成。第一作者为胡名旭,余洪坤和顾凯。同期他们开发的THUNDER冷冻电镜三维重构软件系统集成了这些新算法和新特性,为未来冷冻电镜海量图像数据的实时分析,以及大规模的自动化应用提供了一个可靠的算法和软件基础;同时,也为解析接近原子分辨率的生物结构提供了一套鲁棒、快速的解决方案,显著降低了对用户经验的要求,益于冷冻电镜技术的广泛普及,助力在原子尺度上对生命活动进行观察。

  为了获得一个更有效的算法和计算系统以满足未来高分辨率和大规模应用的需求,李雪明研究组联合电子系沈渊和计算机系杨广文研究组,利用清华大学生物学科和信息学科交叉的优势,将电子工程领域的粒子滤波算法引入到冷冻电镜的图像重构参数搜索中去,发展出一套比现有算法更完善、更有效的贝叶斯统计推断算法。

  这套新算法对高维参数的搜索具有更好的鲁棒性,可以自适应地进行参数的自动调整,以及通过引入一套新的权重机制大幅提高了对系统误差的容忍度。这些优势的整合,使整个系统具有很好的鲁棒性,更适用于未来自动化的运行工作模式。

  同时,在算法的实现过程中,深度融合了大规模并行计算的思路和方法,从而使整个系统具有极高的运算效率,和近乎理想的并行计算性能。未来该系统将能够高效运行于小到一个工作站,大到“太湖之光”这样的超大规模计算系统,适应生命科学研究和药物设计的大量结构测定需求。

  这项工作是三个不同学科研究组交叉研究的阶段性成果,团队正在利用新型的统计推断和机器学习算法将这一工作扩展到对细胞或者细胞器结构的原子分辨率三维重构上去。

  未来的冷冻电镜技术将使人们不必再借助于复杂的生物化学手段来提取蛋白质,而是利用冷冻电镜直接在细胞中对包括蛋白质在内的生物大分子的原子结构和动态变化进行观察和分析,探索生命活动的本质原理,设计能够治愈疾病的药物,造福人类健康。

相关文章

第三届琶洲算法大赛正式启动

4月23日,由广州市人民政府、中国人工智能学会联合主办的第三届琶洲算法大赛正式启动。记者获悉,本届大赛面向国内外开设5个赛区,并首次开启赛区晋级制度。大赛采取线上线下相结合的形式,经过报名、初赛、复赛......

科学家开发冷冻电镜颗粒挑选新方法

人工智能赋能生物学再获新进展。中国科学院生物物理研究所蛋白质科学研究平台生物成像中心与中国科学院自动化研究所多模态人工智能系统实验室杨戈团队合作,以人工智能技术赋能原位结构生物学,提出了一种基于弱监督......

研究提出基于弱监督学习的冷冻电镜颗粒挑选新方法

生物大分子的结构与功能随着细胞生理状态的变化而不断进行动态调整。原位结构生物学是在接近自然生理状态下研究生物大分子结构和功能的科学。原位冷冻电镜技术(Cryo-ET)以高分辨率和在接近生理条件下观察样......

研究提出基于弱监督学习的冷冻电镜颗粒挑选新方法

生物大分子的结构与功能随着细胞生理状态的变化而不断进行动态调整。原位结构生物学是在接近自然生理状态下研究生物大分子结构和功能的科学。原位冷冻电镜技术(Cryo-ET)以高分辨率和在接近生理条件下观察样......

我国科研人员提出冷冻电镜颗粒挑选新方法

“人工智能+”赋能科学研究有新进展。记者12日从中国科学院自动化所获悉,该所和中国科学院生物物理所等单位的科研人员以人工智能技术赋能原位结构生物学,提出了一种基于弱监督深度学习的快速准确颗粒挑选方法D......

利用深度学习对短文本产品名称分类的研究

一、研究背景在数字化浪潮的冲击下,基于产品质量安全监管的信息化基础,运用大数据、自然语言处理、机器学习等技术,让信息横向在不同区域间、纵向在各级市场监管部门流通,是一个有重要意义且需要我们在业务支撑工......

2023医疗大数据:从“生产要素”到“资产”,距离数据流通还有多远?

千禧年后的第二个十年,移动医疗、人工智能等前沿技术的发展唤起医疗数据的需求。作为算法、算力、数据三要素中最常见但又最难获取的要素,医疗数据彼时仍以碎片化、非标准化的形态分散于医院各个系统中。为了寻找智......

首个量子领域大模型上线了!

百度量子计算研究所所长段润尧介绍,该量子领域大模型是在百度文心一言的基础上,使用量子领域高质量数据进行更有针对性的训练和优化而成的。它能更好地理解量子知识,执行量子领域相关任务。据介绍,百度量子领域大......

我国冷冻电镜再发Nature三维结构解析免疫机制

10月2日,《自然》杂志在线发表了我国科学家的一项关于免疫系统如何发挥作用的重要成果。通过海量的实验与计算,来自中国科学院物理所、中国医学科学院等单位的研究人员,成功解析与原核短Ago系统相关的高分辨......

机器学习算法现在可以快速与准确地诊断心脏病发作

心脏病发作的症状有时与非心脏相关的疾病相似,使诊断变得棘手。英国研究人员已经转向机器学习,为医生提供一种快速和准确的诊断心脏病发作的方法,这有可能缩短诊断所需的时间,并为患者提供更高效和有效的治疗。目......