ResDeepGS:基于深度学习的作物表型预测模型及其在基因组选择中的应用与性能优势

【字体: 时间:2025年09月14日 来源:Methods 4.3

编辑推荐:

  本文提出了一种创新的深度学习模型ResDeepGS,通过结合递归特征消除(RFE)和增量学习策略优化特征选择,并集成残差网络与多层卷积神经网络(CNN)结构,显著提升了作物表型预测的准确性和泛化能力。实验结果表明,该模型在小麦、玉米和大豆数据集上均优于当前主流方法(如GBLUP、RF、DeepGS和DNNGP),尤其在谷物硬度(GH)和千粒重(TKW)等性状预测中表现突出,为基因组选择(GS)和作物育种提供了高效计算工具。

  

Highlight

本研究开发的ResDeepGS模型通过深度融合递归特征消除(RFE)与残差网络架构,有效解决了基因组选择中高维数据冗余和梯度异常问题。该模型在多种作物数据集上展现出卓越的预测稳定性和计算效率。

Datasets

实验采用三个代表性作物数据集:包含33,709个DArT标记的2,000份伊朗小麦地方品种、涉及4,931个SNP的2,677个玉米自交系,以及基于50,000个SNP标记的2,900份大豆种质资源。所选性状涵盖谷物形态(如粒长GL、粒宽GW)、生理特性(如籽粒硬度GH)和产量指标(千粒重TKW、籽粒含水量GWC)。

Parameter settings and experimental validation of ResDeepGS

通过网格搜索优化关键超参数:学习率(0.001-0.005)、批量大小(32-128)、卷积层数(3-7层)以及特征历史权重系数α(0.3-0.7)。早停机制(patience=10)和Dropout策略(0.2-0.5)有效抑制过拟合。在五折交叉验证中,ResDeepGS在12个性状预测中均方误差(MSE)平均降低19.7%,收敛速度提升约2.3倍。

Discussion

ResDeepGS的突出优势体现在三方面:首先,增量式特征选择模块将冗余标记剔除效率提升40%,显著降低噪声干扰;其次,残差结构缓解了深层网络梯度消失问题,使模型在有限样本下仍保持高精度(如小麦TKW预测r2达0.89);最后,模块化设计使其可适配不同作物基因组结构,为智慧育种提供通用技术框架。

Uncited references

[27] [28]

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号