随着分析仪器的发展,单个代谢样品中即可检测到成千甚至上万个化合物,如此庞大的数据亟需无监督的自动化鉴定过程。计算机的引入有效解决了大数据处理难题,同时加速了无标准谱图化合物的解析过程,在一定程度上实现了药物代谢产物的自动化鉴定。计算机辅助鉴定方法多种多样,根据其工作原理,现分为化学结构数据库基础上的自动化鉴定、碎片树、基于代谢反应预测的代谢产物鉴定3类,其中化学结构数据库基础上的自动化鉴定适用于无标准谱图的已知化合物的鉴定,碎片树以及基于代谢反应预测的代谢产物鉴定为普适性方法,同时适用于未知代谢产物的分析鉴定。
1 化学结构数据库基础上的自动化鉴定
相对于存在标准质谱图的化合物,数据库收录的具有结构信息的化合物在数目上具有绝对优势,例如质谱专用数据库MassBank中收录了3 127个化合物的26 296张质谱图,而化学结构数据库ChemSpider中收录了580 000多个化合物结构。如果在化合物结构数据库基础上,根据化合物结构即可推测出化合物的主要离子碎片,或者根据离子碎片即可寻找匹配的化合物结构,那么药物代谢产物可鉴定范围将进一步扩大。研究人员基于这些思考,将化学信息学与计算机科学相结合,开发出多种二级质谱、多级质谱的检索与相似度匹配的计算机程序,实现了基于化合物结构数据库的自动化鉴定过程,扩大了药物代谢产物的可鉴定范围。目前相关的方法工具可分为以下3类。
1.1 计算机模拟MS/MS谱图的代谢产物鉴定
该类方法是根据现有数据库中化合物的MS/MS标准谱图规律建立算法,并利用现有数据库中的数据对算法不断优化。代谢鉴定工具通过这些算法对实际谱图进行分析,完成化合物预测、图谱匹配、评分排序等化合物自动化鉴定过程。例如,CFM-ID 是基于二级质谱并运用此原理的网络服务器,其主要通过概率模型预测裂解过程,生成候选化合物的裂解图谱,然后对预测的裂解图谱和实际图谱进行相似性评分。CFM-ID实际应用过程中具有3方面的作用: 1)对已知化合物的二级质谱解析;2)对未知化合物的二级质谱预测;3)通过对特定图谱的候选结构进行预测排序,进而鉴定代谢产物。
1.2 基于裂解方式预测的代谢产物鉴定
此类方法是根据化合物结构,对其所有可能裂解方式进行预测,将所有裂解方式产生的离子碎片组合与实际质谱谱图进行匹配评分,得到最佳候选化合物结构。应用此原理的代谢产物鉴定软件很多,例如MS-Finder 、MetFrag 、MIDAS 、MAGMa 。MIDAS是一种通过将MS/MS谱图与数据库中的代谢产物的预测碎片进行匹配完成代谢产物鉴定的数据库检索方法。为了计算匹配度,MIDAS首先根据化学键断裂一般规律列举出代谢产物的可能碎片并计算其合理性,然后对实验数据的MS/MS谱图与代谢产物预测的MS/MS谱图进行匹配评分。Ridder等 结合多级质谱谱图树,构建了一种以子结构为基础的拓展算法。该算法通过建立候选化合物的子结构分层树与各级碎片离子进行匹配,计算匹配分数,根据其匹配分数对从PubChem数据库得到的候选离子进行排序,获取代谢产物的分子结构。以上2种方法对质谱均要求较高的质量精度。MetFrag则以某一特定的相对分子质量对PubChem、KEGG、ChemSpider等数据库进行检索,然后对合理碎片进行计数,结合碎片峰评分完成对候选化合物的进一步筛选。
1.3 基于分子指纹特征的代谢产物鉴定
该类算法是根据化合物的碎片图谱对分子指纹特征进行预测,然后根据这些特征在结构数据库中进行检索获取候选化合物。Heinonen等 运用机器学习模型(基于支持向量机原理)完成对分子特征的预测和串联质谱中的代谢产物鉴定。该方法首先根据未知化合物的质谱信息预测出化合物多种特征,然后将预测的化合物特征与大型数据库如PubChem进行匹配获取候选化合物结构。其常用的方法有FingerID、CSI:FingerID ,其中CSI:FingerID结合了“碎片树”的思想,详细介绍见“碎片树”部分。
2 碎片树
B ö c k e r 等 于2008年首次提出“ 碎片树”(fragmentation trees,FTs)的概念,这是一种基于质谱碎片的从头鉴定方法。该法不需要化合物的精确分子结构、化学数据库、质谱数据库等信息,以碎片离子为节点,以丢失的基团为连线,表征化合物的裂解途径,运用固定算法计算子树的最佳得分,预测化合物分子式。为了验证方法的可行性,研究人员运用此方法对32个化合物的分子式进行预测,26个化合物的正确分子式位于候选分子式列表的第1位,其余5个化合物的正确分子式也位于候选分子式列表的前五名。该方法提出后,Böcker团队不断地将其完善 ,并将碎片树的思想与机器学习相结合开发出一种基于MS/MS数据对小分子结构进行数据库搜索的新方法——CSI: FingerID ,在应用过程中该方法与现阶段其他的代谢产物鉴定工具如MIDAS、MetFrag、MAGMa、CFM-ID、FingerID相比,均表现出更高的准确性。2016年Böcker等 对“碎片树”算法——SIRIUS系列进行了新的优化,提出了一种碎片树的新计算方法——SIRIUS 3,将原本的“组合优化”转换为“最大后验估计”。相较于前面的方法,SIRIUS 3解决了碎片树的计算难题,在未知化合物分子式的从头鉴定和数据库检索寻找结构相似化合物方面更具突出优势。此外,应用于碎片树的软件还有MoleculePuzzle、ISIS等 。5.3 基于代谢反应预测的代谢产物鉴定
药物代谢产物来源于药物的代谢反应,代谢产物的结构与代谢反应的类型、前体化合物结构性质密切相关。因此研究者利用这些特征,结合化学信息学与化学计量学,开发出一系列代谢产物的预测软件和代谢产物筛选方法,辅助药物代谢产物鉴定。
代谢产物预测软件根据前体化合物的空间结构、化学键的强弱、常见代谢途径,对代谢产物进行预测。目前根据此方法常用的代谢产物预测软件有:
2025年8月15日,北京药理学会药物代谢专业委员会与北京地区多家药企联合举办的首次党建联建活动在北京亦庄成功举办。本次活动以党建联建为纽带,汇聚学界专家与企业代表,围绕药物研发创新、成果转化落地等核......
为促进人工智能(AI)安全治理行业技术发展,加强各相关机构对AI伪造图像检验鉴定的质量管理,建立不同图像鉴定方法/系统的有效性和可比性,中国合格评定国家认可委员会(CNAS)秘书处决定开展“人工智能伪......
近日,在2024数字科技生态大会上,国内单台比特数最多的超导量子计算机天衍-504正式发布。国内单台比特数最多的超导量子计算机天衍-504。中电信量子集团供图据悉,天衍-504超导量子计算机是中电信量......
2024年11月28日,第十一批在韩中国人民志愿军烈士遗骸迎回仪式在辽宁沈阳桃仙国际机场举行。这次共迎回了43位志愿军烈士遗骸和495件遗物,由空军运-20专机从韩国仁川接回,并由歼-20战机护航。这......
——第十四届北京地区药物代谢及药物动力学学术论坛暨第二届质谱技术赋能精准药学前沿论坛成功举行!2024年11月9日,由北京药理学会药物代谢专业委员会主办,首都医科大学附属北京佑安医院、“创新药物非临床......
10月24日,2024中国计算机大会(CNCC2024)在浙江东阳横店开幕,吸引了一万多名计算相关领域学术、教育、企业界人士参会。围绕“发展新质生产力,计算引领未来”主题,800多位国内外知名专家学者......
尽管量子计算机领域的研究进展突飞猛进,但量子计算机的“性情”仍不稳定,容易出错,尚无法投入实际应用。为此,包括谷歌和IBM等在内的众多公司竞相开发量子纠错技术,旨在为最终实现稳定可靠的量子计算系统奠定......
9月16日,信息管理与数学学院、计算机与人工智能学院揭牌仪式举行。中国科学院计算所所长陈熙霖教授、江西师范大学原校长梅国平教授、鹏城实验室副主任石光明教授、南昌大学副校长杜建强教授、华东交通大学副校长......
研究人员开发了一种真菌“生物混合机器人”。图片来源:美国康奈尔大学科技日报北京9月1日电(记者张佳欣)美国康奈尔大学研究人员成功开发出一种由真菌和计算机组成的“生物混合机器人”。这种机器人能够将真菌的......
“CCF王选奖”表彰在计算机领域取得重大理论、技术突破或获得重大科研成果的个人。该奖以我国著名计算机科学家王选先生命名。该奖实行推荐制,每年评选一次,获奖人数不超过二名。其中一名奖励学术,一名奖励技术......