种子被誉为农业的“芯片”,育种科技创新是推动农业发展的核心动力。未来植物育种的新范式是基因组学、基因编辑、合成生物学等生物技术(BT)与数据科学、机器学习、人工智能等信息技术(IT)的多元化融合。农业农村部“十四五”规划将“智慧种业”列在“智慧农业”领域七大攻关任务之首。任务中明确提出:构建数字化育种平台,探索基因型到表型的“智能育种技术体系”,加快“经验育种”向“精确育种”转变的攻关目标。
9月21日,Cell旗下的植物科学领域顶级综述类期刊Trends in Plant Science在线发表了中国农业大学分子设计育种前沿科学中心、国家玉米改良中心王向峰教授与闫军副教授共同撰写的特邀综述:“Machine learning bridges omics sciences and plant breeding”。该综述准确定义了“精准育种”的含义,并将“精准设计育种”划分为“知识驱动的分子设计育种”与“数据驱动的基因组设计育种”。论文重点阐述了机器学习技术如何将“知识”与“数据”转化成为育种服务的驱动力,以及如何为基础研究与育种实践之间建立桥梁,加速实现植物领域的精准设计育种。
最近几十年,植物生物学基础研究产生了大量新的知识和数据,这些知识与数据最终将为植物育种与性状改良而服务。然而,实现植物精准设计育种的终极目标,还需要解决当前植物基础研究与育种实践脱节的问题。作为人工智能的一个分支,机器学习技术因其在整合复杂多变的生物学知识和组学大数据方面的卓越能力而得到广泛应用。

“知识”与“数据”驱动的精准设计育种。 王向峰供图
机器学习主要可以通过两种途径在基础研究和育种实践中建立桥梁。一种途径是从植物生物学的基础研究中认识基因功能和调控机制,从而实现知识驱动的分子设计育种。在明确性状调控基因的功能后,通过分子标记辅助选择、有利等位基因的多基因聚合、基因编辑与合成生物学等技术,对植物品种进行定向改良。另一种途径是直接将机器学习技术应用于商业育种管线,构建各种预测模型和决策算法,从而实现数据驱动的基因组设计育种。
这两种途径在现代商业化育种管线中相互结合并发挥着重要作用。现代育种管线的选择取决于与性状相关的基因或位点的数量:对于主要由遗传背景决定的数量性状,如:产量、生物量、环境适应性等性状,通常采用数据驱动模型来推断表型与全基因组标记之间的相关性;对于由遗传前景决定的多基因性状,如抗病、品质等性状,必须首先明确性状调控基因的分子功能及作用途径,才能将多个基因的优良等位变异精准聚合;对于单基因性状而言,应用基因编辑是人工制造突变,则是性状改良的最佳快捷方式。事实上,只要在植物生物学和育种方面积累了足够的知识与数据,机器学习技术便可以发挥功效以推动植物精确设计育种目标的实现。

各类机器学习算法在植物多组学研究中的应用 王向峰供图
论文首先介绍了现代机器学习技术的主要类型(包括监督式学习、半监督式学习、非监督学习、深度学习等)与最新进展;其次,综述了如何将现代机器学习算法应用于高维多组学数据降维、基因调控网络推断、多组学数据关联分析与基因挖掘,以及候选基因的优先级决策等植物学基础研究中;再次,介绍了基于半监督学习框架的深度学习算法在植物表型组学中的应用进展;最后,介绍了机器学习技术在全基因组选择辅助育种、基因型到表型预测,以及基因型与环境互作建模中的应用进展。在论文的结论与展望部分,讨论了目前机器学习和人工智能技术在植物研究中面临的挑战和潜在解决方案。
此外,本综述还提供了一个应用非监督学习案例,即:如何利用NMF非负矩阵分解算法提高玉米多组学数据关联分析的效率与基因挖掘的精度。

案例:应用NMF降维算法提高基因挖掘的效率 王向峰供图
在全球森林退化加剧与气候变化威胁的背景下,以提升地上碳储量为目标的森林恢复策略面临着土壤碳库恢复滞后、生态系统多功能性提升不足等问题。中国科学院华南植物园科研团队联合德国、美国、捷克、荷兰和意大利等国......
近日,中国热带农业科学院热带生物技术研究所教授吕培涛在《生物技术通报(英文)》(aBIOTECH)发表了综述论文。文章系统阐述了RNA修饰在植物生命活动中的调控作用,深入解析了N6—甲基腺苷(m6A)......
齿肋赤藓(Syntrichiacaninervis)是极端耐干植物的典型代表,能够承受超过98%的细胞脱水,并在遇水后几秒钟恢复光合作用等生理活动,能够快速响应水分的变化。在植物应对水分变化过程中,蛋......
2025年8月15日,新华社客户端转发了《半月谈内部版》2025年第8期“讲述”栏目对植物中文学名系统创建人陈斌惠(也水君)的专访《给全球30万植物一个中文学名》,几个小时内浏览量突破100万人次。半......
近日,中国科学院地球环境研究所的一项研究揭示了全球变化下植物氮磷回收过程的普遍解耦现象,为理解生态系统养分循环响应机制提供了新视角。这一发现突破了传统氮磷循环解耦的理论假设,强调生态模型应纳入植物氮磷......
抗衰商品中的寡肽作为活性成分与皮肤细胞相互作用,加速胶原合成和纤维细胞增殖。寡肽活性成分一些是神经递质或酶抑制剂,另一些是信号肽或载体肽。研究对不同寡肽结构建立单分子特征分析方法,应用于市面不同抗衰产......
随着人工智能(AI)、自动化等技术的持续突破,利用传感器进行数据采集与高速传输,并通过物联网存储海量数据,正持续推进智能化养殖业发展,逐渐成为推动猪育种向精准化、高效化、智能化转型的核心驱动力。从整个......
大约80%的植物病毒依赖媒介昆虫进行传播,媒介昆虫体内的病毒稳态依赖于病毒载量与昆虫免疫系统之间的动态平衡,从而确保虫媒的生存和病毒的高效传播。小RNA介导的RNA干扰(RNAi)是真核生物中普遍存在......
随着高频大功率器件快速发展,系统能耗问题成为制约行业发展的瓶颈。若将电子控制系统比作人体,芯片如同大脑承担核心控制功能,负责数据处理、信号控制和逻辑运算等任务;而电感、变压器等磁性元器件则相当于执行各......
光是植物光合作用的能量来源。作为重要的环境信号,光广泛参与调控植物生长发育的各个阶段。当植物幼苗出土见光后,光信号迅速激活光形态建成,表现为下胚轴生长抑制、子叶张开变绿以启动光合作用。这是植物早期生长......