2021年6月17日,北京大学国际癌症研究院谢正伟团队在Nature Biotechnology(IF=36.6)在线发表了题目为“Prediction of drug efficacy fromtranscriptional profiles with deep learning”的科研论文(图1),揭示了一种基于基因指纹和深度学习的药效预测系统(DLEPS,中文名灵素系统)。
创新药物研发是一个周期长、耗费大的艰难过程。与发达国家相比,我国在创新药研发方面仍有巨大差距。一方面,人工智能和深度学习在复杂体系方面的成功应用使研发人员认识到其在药物研发领域巨大的应用潜力。另一方面,药物研发的各个环节都积累了大量的数据,包括蛋白质三维结构、小分子有机合成通路、小分子-蛋白靶点结合、药物的药代动力学、药物制剂等方面。基于这些数据开发新的深度学习算法使得药物研发正在加速药物研发的进程。
传统的基于靶点的药物开发采取的是“一个分子——一个靶点——一种疾病”的开发策略。然而,这种方法也存在许多困难,包括:1许多疾病的病理机制仍不清楚或发病机制涉及多条途径;2脱靶效应难以控制;3一些靶点难以成药;4生物体系统有代偿机制,导致无法输出药效;5靶点发现的技术手段有限导致结果不可靠等。鉴于上述各种困难,新的、更加高效的计算系统亟需被开发。因为大多数疾病与基因表达谱的特征性变化有关,这些变化又被用作疾病的病理指标。选取基因指纹作为中间指标具有多样性和多种疾病中的普适性。
在该研究中,研究人员首先构建了一个神经网络,使用SMILES化学编码作为输入,以预测L1000数据中测量的转录组变化 (图2)。使用疾病相关基因指纹来反映特定疾病的“内在痕迹”,并且使用基因集合富集分析(GSEA)来评估化合物对疾病的潜在疗效。研究人员将这种方法和模型称为基于深度学习的药效预测系统,中文名为灵素系统。在预测基因表达变化部分,系统可以准确的预测新分子对转录组造成的影响,测试组预测平均相关性达到0.74,分布峰值为0.90 (图3)。
研究人员进一步深入探索了灵素系统的性能,发现它1可以精确预测新结构小分子诱导的基因表达谱变化;2它可以准确的区分结构非常相似的小分子(只差一个基团)诱导的基因表达谱差异。
在实验验证方面,研究员人员针对商用小分子数据库(包括FDA批准药物、天然产物、临床数据库)预测了治疗三种疾病(肥胖、尿酸血症、非酒精性脂肪肝炎NASH)的化合物(图4)。结果表明,对于肥胖,研究人员发现三个DLEPS预测化合物(测试了四个)可降低小鼠的脂肪含量,并且诱导数十个褐变基因(白色脂肪组织变成棕色脂肪组织)表达上调,减轻了小鼠的体重,达到了减肥的目的。对于高尿酸血症,灵素系统成功预测了天然产物紫苏烯,其可降低血清尿酸,效果上优于四种阳性药物,还具有抗炎和抗纤维化的优势。对于NASH,研究人员发现三种MEK-ERK信号通路抑制剂可缓解NASH相关的肝脏病理,也是首次揭示了MEK-ERK通路在NASH中的重要作用。
综上所述,灵素系统可成功应用于筛选治疗肥胖、高尿酸血症和NASH的化合物,总体准确率超过50%。和传统的高通量基因标记筛选方法相比,系统同时考虑多个基因指标,精度更高。该系统不需要预先合成实体分子库,大大的降低了成本和工作量,效率得到很大的提高。和传统的基于靶点的方法相比,灵素系统更加灵活,仅基于基因指纹就可预测候选分子,可以在复杂疾病上得到更好药效的化合物,更快的找到工具分子,然后通过倒推的方式发现疾病的新靶点,从而实现在药效预测和靶点上开发双管齐下、同步进行。在文章涉及的三个实例中,作者先是发现了紫苏烯可以显著降低尿酸水平,然后发现它作用在已知靶点XOD上,Kd=1.5uM。在NASH中,首次发现了MEK-ERK在治疗非酒精性脂肪性肝炎中的作用。小分子-神经网络-基因表达变化-药效的算法框架已经申请国内外ZL。
北京大学国际癌症研究院/基础医学院谢正伟副研究员、郑瑞茂研究员、张宁教授、周虹副教授为本文的通讯作者,北京大学癌症研究院/基础医学院硕士研究生朱杰、郭冰冰、副主任技师王昕、亿药科技成员王靖翔、高明景,为论文的共同第一作者。研究得到了国家重点研究计划合成生物学专项、国家自然科学基金、北京市自然科学基金的支持。
随着生命科学日益精细化,人类对健康的追求已深入至细胞层面。作为细胞的“能量工厂”,线粒体这一微小细胞器的重要性日益凸显,它不仅为生命活动提供能量,更调控着细胞生死,与神经退行性疾病、心血管疾病、代谢综......
2025年9月10日,国家疾病预防控制专家委员会(以下简称“专家委员会”)成立会议在北京召开。国家卫生健康委副主任、国家疾控局局长沈洪兵出席会议,为第一届专家委员会委员颁发聘书并讲话。国家疾控局副局长......
疾病对于个人来说是生死大事,对于社会来说,也是“文明”的大事,文明“创造”了疾病,疾病又反过来“塑造”了文明。这是日本病理史学者立川昭二在其著作《文明的病因:从疾病看待世界文明史》中提出的主要观点。《......
2025年7月7日,《中国疾病预防控制中心周报(英文)》学术交流会(北京站)在北京成功举办。会议由中国疾病预防控制中心(中国预防医学科学院)主办,中国疾病预防控制中心环境所承办。施小明副主任(副院长)......
了解人类DNA如何在世代间变异,对于评估遗传疾病风险、理解人类的进化过程至关重要。但直到现在,研究人员一直难以涉足人类DNA中一些变异最频繁的区域。美国犹他大学、华盛顿大学、太平洋生物科学公司等机构的......
国家疾控局综合司关于征集2025年度疾病预防控制标准立项建议的通知各有关单位:为不断深化疾病预防控制标准工作,根据《中华人民共和国标准化法》《疾病预防控制标准管理办法》,现公开征集2025年度疾病预防......
图ICRAFT靶点发现流程、在癌细胞和T细胞中靶向TNFAIP3促进肿瘤免疫的示意图在国家自然科学基金“免疫力数字解码”重大研究计划项目(批准号:92374116)等资助下,北京大学前沿交叉研究院曾泽......
科研人员开发出一款人工智能(AI)工具,能够通过分析血液样本中免疫细胞的基因序列,一次性诊断多种病毒感染及确定健康状况。在2月20日发表于《科学》的一项涉及近600人的研究中,该工具成功识别出受试者的......
采上几滴血就能诊断一个人会不会患病,如同科幻电影才会出现的场景,正在成为现实。近日央视报道,复旦大学科研团队研发出“人类健康与疾病蛋白质组图谱”这一突破性研究成果。通过AI算法的辅助,医生只需通过简单......
2月23日,记者从海南医科大学获悉,该校热带医学院杨国静教授团队近日在国际医学期刊《英国医学杂志》在线发表论文《中国被忽视热带病负担估计的差异:真实世界数据与GBD2021的比较研究(2004—202......