发布时间:2023-02-28 15:57 原文链接: 基因组育种大数据计算新工具“天权”发布

  近日,国际学术期刊《核酸研究》(Nucleic Acids Research)发表了华中农业大学动物遗传育种团队开发的基因组育种大数据计算新工具HIBLUP,中文名为“天权”。相关论文被期刊评为“突破性进展”论文。

  该研究系统分析了已有遗传评估算法特点,针对现有算法在处理快速增长的基因组育种大数据时面临的瓶颈问题,首创基于V矩阵的“HE+PCG”策略,可完全避免遗传评估计算过程中的大矩阵求逆,开发出更适合基因组育种大数据时代的高性能计算新工具HIBLUP。与现有工具相比,“天权”计算速度最快且消耗内存最少,而且基因分型个体在群体中占比越大,优势愈明显。此外,“天权”软件功能丰富、操作便捷,可运行于Windows、Linux、macOS等平台,并且全面适配国产Kunpeng(鲲鹏)生态。

  遗传评估是育种的基础,随着基因组育种时代的来临,育种数据规模快速增长,评估算法的计算速度已成为育种中的关键限制因素。遗传评估主要包括方差组分估计及育种值求解两个步骤,其中方差组分估计的计算复杂度高,通常数月或一年更新一次;育种值求解复杂度相对较低,需要日常计算更新。

  目前,国际现有育种工具(如丹麦的DMU、美国的BLUPF90、英国的ASReml等)采用的评估算法都是以混合模型方程组(Mixed model equation, MME)为核心,即MME策略,需要求解个体关系矩阵和MME左手项(Left hand side, LHS)的逆矩阵。传统育种利用系谱构建个体亲缘关系矩阵,评估过程涉及的矩阵极其稀疏,FSPAK算法(美国ZL)能够以极快速度求解稀疏矩阵LHS的逆矩阵,是基于系谱信息的传统育种计算必不可少的核心程序。然而,随着基因组育种时代的来临,个体亲缘关系矩阵构建逐渐由系谱过渡到基因组信息,关系矩阵及LHS矩阵也相应由全稀疏转变为半稠密或全稠密,FSPAK算法并不适用于稠密矩阵运算,其劣势逐渐显现。

  虽然FSPAK团队针对性地做出了优化,例如,推出了能够自动鉴别稀疏及稠密块的FSPAK升级版“YAMS”,以及利用区分核心群和非核心群的方式近似求解基因组个体关系逆矩阵的“APY”策略等,一定程度上提升了数据处理能力,但仍然依赖MME框架,无法避免多次大矩阵的求逆运算。当基因分型个体规模累计到数十万时,MME策略面临计算效率低及内存需求大的双重问题,并不能适应基因组大数据时代的育种计算需求。

  为解决这一难题,“天权”首创基于方差协方差V矩阵的“HE+PCG”策略,即利用HE回归法估计方差组分,采用基于V矩阵的PCG迭代法估计育种值(如图2所示),可完全避免遗传评估计算过程中的大矩阵求逆,并且V矩阵的维度(有表型个体数)远低于MME方程的维度(所有个体数×遗传随机效应个数)。因此,无论是计算效率还是内存需求上,“天权”全面优于基于MME策略的现有工具,更适合基因组育种时代的大数据计算。

  “天权”软件自2018年初全国畜牧总站组织基因组育种算法交流时启动研发,历经5年,在功能模块、计算性能、用户体验等方面不断升级完善,目前已被来自全球50多个国家的用户使用。“天权”具备丰富的遗传分析功能,包含常用的单性状模型、重复记录模型、多性状模型等,支持环境互作、遗传互作、环境与遗传互作等分析,是目前唯一兼具基因组选种及基因组精准选配功能的育种计算工具。目前,“天权”已在扬翔、中粮、海大、金旭等多个大型农牧企业应用,为我国种猪基因组高效选育,以及三元商品猪生产精准选配提供了国产化新工具。

  华中农业大学博士后尹立林和武汉理工大学博士生张浩浩为论文共同第一作者,华中农业大学教授赵书红、刘小磊和李新云为论文共同通讯作者。该研究受到国家重点研发计划青年科学家项目、国家自然科学基金、国家生猪体系岗位科学家项目的资助。

  HIBLUP(天权)软件下载及使用教程网站见:https://www.hiblup.com

  相关论文信息:https://doi.org/10.1093/nar/gkad074

相关文章

基因解码揭示人类无尾之谜

纽约大学格罗斯曼医学院(NYUGrossmanSchoolofMedicine)的研究人员进行的一项新研究表明,我们远古祖先的基因变化可以部分解释为什么人类不像猴子那样有尾巴。这项研究成果最近发表在《......

人与猿类如何在进化中“甩掉”尾巴

猴子有尾巴,而人类和猿类的尾巴却在进化中消失了,是什么在其中起了关键作用?《自然》28日发表的一篇论文,报道了人类和猿类演化掉尾巴的遗传学基础。灵长类动物尾部表型的系统发育树(Ma表示百万年前)。图片......

一步到位沉默一个小鼠胆固醇基因

意大利科学家在一项小鼠研究中展示了无需永久性基因组编辑,也可对一个控制胆固醇水平的基因做到长效抑制。这一靶向表观遗传沉默(不用直接改变DNA序列就可改变基因功能)的效果在小鼠中持续近1年,令循环胆固醇......

安捷伦一季度营收缩水5.6%,仍稳坐16.6亿美元大关

2月27日,安捷伦科技公司(纽约证券交易所代码:A)公布截至2024年1月31日的2024财年第一季度财报。第一季度营收为16.6亿美元,与2023年第一季度相比下降5.6%,核心营收(1)下降6.4......

多样化菌群共存现象有了新解释

近日,中国科学院深圳先进技术研究院合成生物学研究所副研究员王腾团队在《自然—通讯》发表研究成果。该研究从理论上揭示了微生物群落中广泛存在的水平基因流动可以帮助竞争性微生物群体突破物种多样性“极限”,促......

与DNA损伤相关的145个基因“现形”

研究示意图。图片来源:《自然》杂志据最新一期《自然》杂志报道,通过对近1000只转基因小鼠开展研究,英国科学家发现了100多个与DNA损伤有关的关键基因。这项研究为开发癌症和神经退行性疾病个性化疗法提......

关节炎滑膜组织基因表达调控图谱,揭示关节炎风险位点的功能特征

关节炎是一种常见的关节病变,主要表现为滑膜增生、软骨变性及软骨下骨增生,造成关节功能丧失和生活质量下降,在60岁以上人群发病率超过50%,全球范围内有数亿人受到影响。全基因组关联研究(Genome-w......

直接面向消费者的基因检测市场规模、趋势、2032年报告

2022年,全球直接面向消费者的基因检测市场规模为17.2亿美元,预计到2032年将达到76亿美元左右,2023年至2032年复合年增长率为16.10%。市场概况直接面向消费者的基因检测市场是一个快速......

多部门联合开展全国数据资源调查

国家数据局19日发布消息,为摸清数据资源底数,加快数据资源开发利用,更好发挥数据要素价值,国家数据局、中央网信办等部门联合开展全国数据资源情况调查,调研各单位数据资源生产存储、流通交易、开发利用、安全......

Nature最新文章:基因测序游戏规则正在被改写,速度翻倍,仅需数小时

超高速测序推动基因组诊断快速发展简化的DNA和RNA测序工作流正在帮助临床医生在几天甚至几小时内提供迅速的有针对性的护理    约十年前,澳大利亚墨尔本的默多克......