
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:利用基于集成的基因组预测解决性状基因组到表型(G2P)维度的育种视角
【字体: 大 中 小 】 时间:2025年07月05日 来源:Theoretical and Applied Genetics 4.4
编辑推荐:
这篇综述探讨了如何利用集成多样的基因组到表型(G2P)模型来应对复杂性状的高维度挑战,强调"育种背景"(breeding context)对全基因组预测(WGP)效果的关键影响。文章创新性地提出将作物生长模型(CGM)与G2P模型结合形成CGM-G2P框架,并通过玉米TeoNAM实验证明集成人工智能/机器学习(AI-ML)算法能有效揭示性状遗传架构的新维度,为预测育种开辟新路径。
现代作物育种面临的核心挑战在于理解性状从基因组到表型(G2P)的复杂映射关系。随着高通量测序和表型组学技术的发展,研究者能够建模序列变异与表型变异间的多维关系,但这些关系受到选择压力和环境的显著影响。研究表明,性状G2P维度和"育种背景"共同决定了不同全基因组预测(WGP)方法的实际预测能力。
"多样性预测定理"(Diversity Prediction Theorem)为集成预测提供了理论框架。该定理表明,由n个预测模型(M)组成的集成预测误差,将低于单个模型误差的平均值,其降低幅度与模型间的预测技能多样性相关。数学表达式为:
(x?M-xT)2 = Σ(xiM-xT)2/n - Σ(xiM-x?M)2/n
其中xiM表示第i个模型的预测值,xT为真实值,x?M为所有模型的预测均值。
性状遗传架构包含多个关键组分:(1)数量性状位点(QTL)的数量和基因组分布;(2)QTL等位基因在参考群体(RPG)中的频率和结构组织;(3)QTL效应大小的分布;(4)基因作用模式,包括加性、非加性、顺式作用(cis-Acting)和反式作用(trans-Acting);(5)QTL与环境互作。这些组分共同构成了性状G2P的高维度特征。
作物生长模型(CGM)为研究性状网络提供了层次化框架。CGM-G2P混合模型结合了CGM对产量形成过程的理解和G2P模型对性状遗传架构的解析,能够更好地模拟数量性状位点(QTL)在性状网络中的作用及其与环境互作。通过设计包含不同环境类型的多环境试验(MET),可以暴露影响选择轨迹的性状×环境互作维度。
人工智能和机器学习(AI-ML)预测算法为集成WGP带来了新的模型多样性。在玉米TeoNAM实验中,比较了六种WGP方法:rrBLUP、BayesB、RKHS、随机森林(RF)、支持向量回归(SVR)和图注意力网络(GAT)。结果显示集成预测在准确性和均方误差上都优于单个方法,且不同方法揭示了基因组区域作用的不同模式。

将符号化模型(如CGM)与子符号化模型(如AI-ML算法)相结合的融合模型,有望更好地利用先验生物学知识。同时,需要设计大规模实验来验证集成预测方法在长期育种中的效果,特别是在应对气候变化和推动可持续农业方面的潜力。

生物通微信公众号
知名企业招聘