2021年6月17日,北京大学国际癌症研究院谢正伟团队在Nature Biotechnology(IF=36.6)在线发表了题目为“Prediction of drug efficacy fromtranscriptional profiles with deep learning”的科研论文(图1),揭示了一种基于基因指纹和深度学习的药效预测系统(DLEPS,中文名灵素系统)。

  

  创新药物研发是一个周期长、耗费大的艰难过程。与发达国家相比,我国在创新药研发方面仍有巨大差距。一方面,人工智能和深度学习在复杂体系方面的成功应用使研发人员认识到其在药物研发领域巨大的应用潜力。另一方面,药物研发的各个环节都积累了大量的数据,包括蛋白质三维结构、小分子有机合成通路、小分子-蛋白靶点结合、药物的药代动力学、药物制剂等方面。基于这些数据开发新的深度学习算法使得药物研发正在加速药物研发的进程。

  传统的基于靶点的药物开发采取的是“一个分子——一个靶点——一种疾病”的开发策略。然而,这种方法也存在许多困难,包括:1许多疾病的病理机制仍不清楚或发病机制涉及多条途径;2脱靶效应难以控制;3一些靶点难以成药;4生物体系统有代偿机制,导致无法输出药效;5靶点发现的技术手段有限导致结果不可靠等。鉴于上述各种困难,新的、更加高效的计算系统亟需被开发。因为大多数疾病与基因表达谱的特征性变化有关,这些变化又被用作疾病的病理指标。选取基因指纹作为中间指标具有多样性和多种疾病中的普适性。

  

  在该研究中,研究人员首先构建了一个神经网络,使用SMILES化学编码作为输入,以预测L1000数据中测量的转录组变化 (图2)。使用疾病相关基因指纹来反映特定疾病的“内在痕迹”,并且使用基因集合富集分析(GSEA)来评估化合物对疾病的潜在疗效。研究人员将这种方法和模型称为基于深度学习的药效预测系统,中文名为灵素系统。在预测基因表达变化部分,系统可以准确的预测新分子对转录组造成的影响,测试组预测平均相关性达到0.74,分布峰值为0.90 (图3)。

  

  研究人员进一步深入探索了灵素系统的性能,发现它1可以精确预测新结构小分子诱导的基因表达谱变化;2它可以准确的区分结构非常相似的小分子(只差一个基团)诱导的基因表达谱差异。

  在实验验证方面,研究员人员针对商用小分子数据库(包括FDA批准药物、天然产物、临床数据库)预测了治疗三种疾病(肥胖、尿酸血症、非酒精性脂肪肝炎NASH)的化合物(图4)。结果表明,对于肥胖,研究人员发现三个DLEPS预测化合物(测试了四个)可降低小鼠的脂肪含量,并且诱导数十个褐变基因(白色脂肪组织变成棕色脂肪组织)表达上调,减轻了小鼠的体重,达到了减肥的目的。对于高尿酸血症,灵素系统成功预测了天然产物紫苏烯,其可降低血清尿酸,效果上优于四种阳性药物,还具有抗炎和抗纤维化的优势。对于NASH,研究人员发现三种MEK-ERK信号通路抑制剂可缓解NASH相关的肝脏病理,也是首次揭示了MEK-ERK通路在NASH中的重要作用。

  

  综上所述,灵素系统可成功应用于筛选治疗肥胖、高尿酸血症和NASH的化合物,总体准确率超过50%。和传统的高通量基因标记筛选方法相比,系统同时考虑多个基因指标,精度更高。该系统不需要预先合成实体分子库,大大的降低了成本和工作量,效率得到很大的提高。和传统的基于靶点的方法相比,灵素系统更加灵活,仅基于基因指纹就可预测候选分子,可以在复杂疾病上得到更好药效的化合物,更快的找到工具分子,然后通过倒推的方式发现疾病的新靶点,从而实现在药效预测和靶点上开发双管齐下、同步进行。在文章涉及的三个实例中,作者先是发现了紫苏烯可以显著降低尿酸水平,然后发现它作用在已知靶点XOD上,Kd=1.5uM。在NASH中,首次发现了MEK-ERK在治疗非酒精性脂肪性肝炎中的作用。小分子-神经网络-基因表达变化-药效的算法框架已经申请国内外ZL。

  北京大学国际癌症研究院/基础医学院谢正伟副研究员、郑瑞茂研究员、张宁教授、周虹副教授为本文的通讯作者,北京大学癌症研究院/基础医学院硕士研究生朱杰、郭冰冰、副主任技师王昕、亿药科技成员王靖翔、高明景,为论文的共同第一作者。研究得到了国家重点研究计划合成生物学专项、国家自然科学基金、北京市自然科学基金的支持。


相关文章

研究揭示全球早发骨关节炎疾病负担

原文地址:http://news.sciencenet.cn/htmlnews/2024/4/520158.shtm记者4月1日从中南大学湘雅医院获悉,该院骨科、老年骨关节疾病防治教育部重点实验室科研......

东南大学研究者们揭示了治疗恶性胶质瘤的潜在靶点

多形性胶质母细胞瘤是一种常见的中枢神经系统恶性肿瘤,是严重威胁人类健康的疾病之一。由于胶质瘤细胞具有快速增殖、迁移和侵袭的特点,以及刺激血管生成的能力,胶质瘤以侵袭性和扩张性的方式生长,随后发展到更高......

Nature:新研究揭示血液生物标志物与疾病之间关联

在一项新的研究中,来自芬兰奥卢大学和英国剑桥大学等研究机构的研究人员发现,血液生物标志物与疾病之间存在许多关联,并确定了400多个影响代谢调节的基因组区域,其中许多发现都是全新的。相关研究结果于202......

超2.75亿个人类基因新变异发现

美国科学家在一项最新研究中,对美国国立卫生研究院全民研究计划“我们所有人”中近25万名参与者的基因组数据进行了分析。结果,他们发现了超过2.75亿个以前未报告的基因变异,其中近400万个变异可能会对人......

一生中患病的几率或可预测,十种慢性病遗传风险估算更接近临床

通过分析基因组中数百万个微小的遗传差异,就可预测一个人一生中患某种疾病的几率。在过去的10年中,研究人员为数十种疾病制定了风险评分,希望有一天患者能利用这些信息来降低患病风险。在《自然·医学》杂志最新......

卫健委关于“常见多发病防治研究”等6个专项立项建议的通知

为推进国家重点研发计划的专项项目立项工作,发挥相关单位和专家在项目需求确定方面的专业优势,科教司现向各有关单位及专业人士公开征集与卫生健康领域相关的重点专项科技问题及项目建议。一、总体定位重点围绕卫生......

全球最大古人类基因库创建,基因和疾病历史传播情况绘成

1月11日,大型国际专家团队分析了34000年前生活在西欧和亚洲的近5000名人类的骨骼和牙齿化石,创建出世界上最大的古人类基因库。通过对古人类DNA进行测序并将其与现代样本进行比较,团队绘制了基因和......

推动疾病预防控制事业高质量发展(权威发布)

近日,国务院办公厅印发《关于推动疾病预防控制事业高质量发展的指导意见》(以下简称《指导意见》)。12月28日,国务院新闻办举行国务院政策例行吹风会,邀请有关部门负责同志介绍了相关情况。“党的十八大以来......

卫健委:当前国内新冠疫情处于低水平流行

今天(28日)下午,国家卫生健康委召开新闻发布会,介绍冬季呼吸道疾病防治和元旦期间健康提示有关情况。中国疾控中心传染病管理处呼吸道传染病室主任彭质斌介绍,全球新冠疫情仍在流行,病毒还在不断变异。近期J......

揭示新的药物靶点:KRAS蛋白的构象控制位点

控制KRAS:揭示关键癌症蛋白的变构位点研究人员在基因组调控中心和威康萨克研究所利用深度突变扫描技术全面识别了蛋白质KRAS中的变构控制位点,该蛋白质是许多类型的癌症中最常见的突变基因之一。科学家们使......