综述:利用基于集成的基因组预测解决性状基因组到表型(G2P)维度的育种视角

【字体: 时间:2025年07月05日 来源:Theoretical and Applied Genetics 4.4

编辑推荐:

  这篇综述探讨了如何利用集成多样的基因组到表型(G2P)模型来应对复杂性状的高维度挑战,强调"育种背景"(breeding context)对全基因组预测(WGP)效果的关键影响。文章创新性地提出将作物生长模型(CGM)与G2P模型结合形成CGM-G2P框架,并通过玉米TeoNAM实验证明集成人工智能/机器学习(AI-ML)算法能有效揭示性状遗传架构的新维度,为预测育种开辟新路径。

  

育种视角下的G2P维度挑战

现代作物育种面临的核心挑战在于理解性状从基因组到表型(G2P)的复杂映射关系。随着高通量测序和表型组学技术的发展,研究者能够建模序列变异与表型变异间的多维关系,但这些关系受到选择压力和环境的显著影响。研究表明,性状G2P维度和"育种背景"共同决定了不同全基因组预测(WGP)方法的实际预测能力。

集成预测的理论基础

"多样性预测定理"(Diversity Prediction Theorem)为集成预测提供了理论框架。该定理表明,由n个预测模型(M)组成的集成预测误差,将低于单个模型误差的平均值,其降低幅度与模型间的预测技能多样性相关。数学表达式为:

(x?M-xT)2 = Σ(xiM-xT)2/n - Σ(xiM-x?M)2/n

其中xiM表示第i个模型的预测值,xT为真实值,x?M为所有模型的预测均值。

性状遗传架构的现代解读

性状遗传架构包含多个关键组分:(1)数量性状位点(QTL)的数量和基因组分布;(2)QTL等位基因在参考群体(RPG)中的频率和结构组织;(3)QTL效应大小的分布;(4)基因作用模式,包括加性、非加性、顺式作用(cis-Acting)和反式作用(trans-Acting);(5)QTL与环境互作。这些组分共同构成了性状G2P的高维度特征。

作物生长模型的整合应用

作物生长模型(CGM)为研究性状网络提供了层次化框架。CGM-G2P混合模型结合了CGM对产量形成过程的理解和G2P模型对性状遗传架构的解析,能够更好地模拟数量性状位点(QTL)在性状网络中的作用及其与环境互作。通过设计包含不同环境类型的多环境试验(MET),可以暴露影响选择轨迹的性状×环境互作维度。

AI-ML算法的创新贡献

人工智能和机器学习(AI-ML)预测算法为集成WGP带来了新的模型多样性。在玉米TeoNAM实验中,比较了六种WGP方法:rrBLUP、BayesB、RKHS、随机森林(RF)、支持向量回归(SVR)和图注意力网络(GAT)。结果显示集成预测在准确性和均方误差上都优于单个方法,且不同方法揭示了基因组区域作用的不同模式。

育种实践的关键启示

  1. 育种背景至关重要:选择历史、RPG和TPE共同决定了G2P关系的可预测性
  2. 高G2P维度是常态:大多数产量相关性状受众多小效应QTL控制
  3. 环境采样策略:MET设计应充分代表目标环境群体(TPE)的不同环境型
  4. 集成方法的优势:不同WGP方法可捕捉性状遗传架构的不同维度

未来发展方向

将符号化模型(如CGM)与子符号化模型(如AI-ML算法)相结合的融合模型,有望更好地利用先验生物学知识。同时,需要设计大规模实验来验证集成预测方法在长期育种中的效果,特别是在应对气候变化和推动可持续农业方面的潜力。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号