水稻基因组选择新突破:Rice3KGS平台助力大规模育种精准预测

【字体: 时间:2025年05月11日 来源:Plant Communications 9.4

编辑推荐:

  本研究针对基因组选择(GS)中训练群体构建耗时耗力的问题,开发了集成贝叶斯优化的LightGBM模型(LGBMY)和Rice3KGS网络平台。该平台整合3,000份水稻基因组数据(3KRG)的56个性状和7类分子标记,实现跨亚种预测,平均准确率提升10.7%,为作物智能育种提供高效工具。

  

研究背景与意义
传统作物育种依赖表型筛选和分子标记辅助选择(MAS),但面对复杂性状时效率受限。基因组选择(GS)通过全基因组标记预测表型,成为智能育种的核心技术。然而,GS应用存在三大瓶颈:训练群体构建成本高、模型预测稳定性不足、跨亚种适用性差。尤其在水稻育种中,3,000份基因组资源(3KRG)尚未被系统整合为标准化训练群体。

研究设计与方法
安徽农业大学联合中国农科院等团队开发了Rice3KGS平台,关键技术包括:

  1. 基于3KRG项目构建包含56个性状(产量、抗逆等6大类)和7类分子标记(404K SNP、104K缺失等)的训练群体;
  2. 开发LGBMY模型(LightGBM融合贝叶斯优化),通过10折交叉验证对比8种模型(gBLUP、XGBoost等);
  3. 建立交互式网站支持亚种选择、模型定制和精英材料筛选功能。

研究结果

1. LGBMY模型性能突破
通过比较7个农艺性状预测表现,LGBMY较原LightGBM平均准确率提升5.2%(P<0.05),根均方误差(RMSE)降低3.1%。其中蜜露产量(HP)和耐热性(HT)预测精度显著提高12.9%和8.9%。与传统gBLUP相比,LGBMY在多数性状上平均优势达10.7%,但gBLUP在种子休眠(SD)等性状仍具特异性优势。

2. 多维度数据资源整合
平台包含:

  • 表型数据:124,000条环境校正值(BLUP/BLUE)
  • 基因型数据:结构变异(SV)中缺失标记预测准确率最高(GW性状达0.76),短串联重复(STR)表现最差
  • 亚种分层:Xian与Geng亚种内预测准确率(0.49)显著高于跨亚种预测(0.06)

3. 群体结构影响机制
六类遗传群体(Aus/GJ-tmp/XI-1A等)分析显示:

  • GJ-trp群体作为"中间训练群体"对Xian亚种预测准确率达0.32
  • 群体遗传距离每增加0.1,预测精度下降23%(P<0.01)

结论与展望
该研究创建了首个整合多组学数据的水稻GS平台Rice3KGS,其创新性体现在:

  1. 提出LGBMY融合模型,突破机器学习在GS中的参数优化瓶颈;
  2. 揭示SV标记在粒型性状预测中的特殊价值;
  3. 确立群体遗传结构对GS预测的量化影响规律。平台已应用于中国南方杂交稻育种,缩短育种周期约40%。未来可通过纳入表观基因组数据进一步提升复杂性状预测能力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号