发布时间:2022-09-22 19:42 原文链接: 机器学习技术加速植物精准设计育种

种子被誉为农业的“芯片”,育种科技创新是推动农业发展的核心动力。未来植物育种的新范式是基因组学、基因编辑、合成生物学等生物技术(BT)与数据科学、机器学习、人工智能等信息技术(IT)的多元化融合。农业农村部“十四五”规划将“智慧种业”列在“智慧农业”领域七大攻关任务之首。任务中明确提出:构建数字化育种平台,探索基因型到表型的“智能育种技术体系”,加快“经验育种”向“精确育种”转变的攻关目标。

9月21日,Cell旗下的植物科学领域顶级综述类期刊Trends in Plant Science在线发表了中国农业大学分子设计育种前沿科学中心、国家玉米改良中心王向峰教授与闫军副教授共同撰写的特邀综述:“Machine learning bridges omics sciences and plant breeding”。该综述准确定义了“精准育种”的含义,并将“精准设计育种”划分为“知识驱动的分子设计育种”与“数据驱动的基因组设计育种”。论文重点阐述了机器学习技术如何将“知识”与“数据”转化成为育种服务的驱动力,以及如何为基础研究与育种实践之间建立桥梁,加速实现植物领域的精准设计育种。

最近几十年,植物生物学基础研究产生了大量新的知识和数据,这些知识与数据最终将为植物育种与性状改良而服务。然而,实现植物精准设计育种的终极目标,还需要解决当前植物基础研究与育种实践脱节的问题。作为人工智能的一个分支,机器学习技术因其在整合复杂多变的生物学知识和组学大数据方面的卓越能力而得到广泛应用。

A.jpg

“知识”与“数据”驱动的精准设计育种。   王向峰供图

机器学习主要可以通过两种途径在基础研究和育种实践中建立桥梁。一种途径是从植物生物学的基础研究中认识基因功能和调控机制,从而实现知识驱动的分子设计育种。在明确性状调控基因的功能后,通过分子标记辅助选择、有利等位基因的多基因聚合、基因编辑与合成生物学等技术,对植物品种进行定向改良。另一种途径是直接将机器学习技术应用于商业育种管线,构建各种预测模型和决策算法,从而实现数据驱动的基因组设计育种。

这两种途径在现代商业化育种管线中相互结合并发挥着重要作用。现代育种管线的选择取决于与性状相关的基因或位点的数量:对于主要由遗传背景决定的数量性状,如:产量、生物量、环境适应性等性状,通常采用数据驱动模型来推断表型与全基因组标记之间的相关性;对于由遗传前景决定的多基因性状,如抗病、品质等性状,必须首先明确性状调控基因的分子功能及作用途径,才能将多个基因的优良等位变异精准聚合;对于单基因性状而言,应用基因编辑是人工制造突变,则是性状改良的最佳快捷方式。事实上,只要在植物生物学和育种方面积累了足够的知识与数据,机器学习技术便可以发挥功效以推动植物精确设计育种目标的实现。

B.jpg

各类机器学习算法在植物多组学研究中的应用      王向峰供图

论文首先介绍了现代机器学习技术的主要类型(包括监督式学习、半监督式学习、非监督学习、深度学习等)与最新进展;其次,综述了如何将现代机器学习算法应用于高维多组学数据降维、基因调控网络推断、多组学数据关联分析与基因挖掘,以及候选基因的优先级决策等植物学基础研究中;再次,介绍了基于半监督学习框架的深度学习算法在植物表型组学中的应用进展;最后,介绍了机器学习技术在全基因组选择辅助育种、基因型到表型预测,以及基因型与环境互作建模中的应用进展。在论文的结论与展望部分,讨论了目前机器学习和人工智能技术在植物研究中面临的挑战和潜在解决方案。

此外,本综述还提供了一个应用非监督学习案例,即:如何利用NMF非负矩阵分解算法提高玉米多组学数据关联分析的效率与基因挖掘的精度。

C.jpg

案例:应用NMF降维算法提高基因挖掘的效率   王向峰供图

相关文章

萤火牵牛花来了,发光植物首次进入美国市场

现在,美国的消费者可以预订一种持续发光的基因工程植物了。美国48个州的居民只需花29美元就可以得到一株能持续发出淡淡绿色光芒的矮牵牛。美国生物技术公司LightBio将于4月份开始运送一批5万株“萤火......

全球首次|新研究揭示外来植物的多维入侵机制

2月13日,华东师范大学生态与环境科学学院和浙江天童森林生态系统国家野外科学观测研究站研究员郭文永团队,首次在全球尺度上阐明了多因子间复杂的交互关系及其对外来植物入侵的复合驱动机制,相关研究在线发表于......

美国开发出可加速材料创新的机器学习模型

美国罗切斯特大学科研人员开发出一个机器学习模型,可对X射线衍射(XRD)实验产生的大量数据进行分析以加速材料创新。科研人员利用涵盖了不同实验条件和晶体特性的无机材料实验数据来训练该模型,并根据布拉格定......

植物性系统演变过程中的自交综合征发育研究获进展

被子植物交配系统频繁地由异交向自交转变,约有10%~15%的物种呈现高度自交的特征。自交的谱系/物种在特定条件下可能受到自然选择的青睐,尤其是当自交过程中繁殖保障优势(reproductiveassu......

文章论述机器学习高精度化学反应势能面构建

近日,中国科学院大连化学物理研究所研究员傅碧娜和张东辉院士受邀发表了机器学习高精度化学反应势能面构建的综述文章,系统介绍了团队近几年在基本不变量-神经网络高精度势能面构建方法方面的发展和应用,探讨了该......

科学家开发一款多功能植物小RNA分析工具

近日,《科学通报》在线发表了华南农业大学园艺学院教授夏瑞团队最新研究成果,他们研究开发出一款多功能植物小RNA分析工具——sRNAminer,可便于研究人员进行一站式小RNA分析及可视化。sRNAmi......

多功能植物小RNA分析工具|一站式小RNA分析及可视化

日,《科学通报》在线发表了华南农业大学园艺学院教授夏瑞团队最新研究成果,他们研究开发出一款多功能植物小RNA分析工具——sRNAminer,可便于研究人员进行一站式小RNA分析及可视化。据介绍,植物小......

5G与智慧农业育种论坛成功召开

12月7日,2023世界5G大会平行论坛之一的5G与智慧农业育种论坛在河南郑州成功召开。论坛以“5G加持生物育种”为主题,邀请了国内外专家院士、解决方案提供商、应用企业围绕5G等技术在智慧农业育种中的......

植物所在植物转座子进化方面取得进展

转座子(Transposableelements,TEs)是较多生物基因组中主要的组成部分(在玉米中可达到80%以上)。与单碱基变异相比,转座子序列长、突变速率快,可更快速地产生大效应的突变。转座子能......

植物排放的挥发性有机物如何检测?在线质谱仪轻松解决

1引言绿色植物是自然界生态系统中重要的组成部分,它一方面从环境中吸收CO2,进行光合作用形成自身所需的有机物,放出O2,另一方面,也向环境中释放微量的挥发性有机物(Volatileorganiccom......