基于机器学习的土耳其六棱大麦种质资源农艺性状解析与遗传多样性预测

【字体: 时间:2025年04月29日 来源:Euphytica 1.6

编辑推荐:

  本研究针对现代大麦遗传多样性受限制约产量提升的瓶颈问题,对土耳其Osman Tosun基因库保存的445份六棱大麦种质开展农艺形态学表征,结合主成分分析(PCA)和XGBoost等机器学习算法,首次系统解析了该资源的表型多样性,筛选出具有早熟、高穗粒数和千粒重等优异性状的基因型,并建立HI(收获指数)预测模型(R2=0.998),为拓宽大麦基因库和精准育种提供重要资源与方法学支撑。

  

论文解读

在全球人口增长与气候变化双重压力下,农作物遗传多样性萎缩已成为制约粮食安全的重大隐患。作为世界第四大谷物的栽培大麦(Hordeum vulgare L.),其现代品种因长期依赖狭窄的精英种质库,导致遗传基础日益薄弱,抗逆性和产量提升遭遇瓶颈。尤其值得注意的是,占全球基因库23%的大麦地方品种中,源自土耳其的种质因其长期适应干旱、盐碱等逆境而蕴含宝贵遗传资源,但六棱大麦(Hordeum vulgare subsp. hexastichon)种质却长期缺乏系统评价。

针对这一现状,安卡拉大学联合土耳其农业与林业部大田作物研究中心等机构的研究团队,对Osman Tosun基因库保存60余年的445份六棱大麦种质(含125份土耳其地方品种和281份国际资源)展开多维解析。研究通过22项农艺性状(11项定性、11项定量)评估,结合机器学习预测模型,不仅挖掘出具有突破性高产潜力的基因型,更建立了高效的性状预测体系。相关成果发表于《Euphytica》,为应对气候变化下的作物改良提供了"基因资源+算法工具"的双重解决方案。

研究采用田间增强设计(augmented block design),在安卡拉半干旱试验区种植材料,记录开花期(DFL)、株高(PH)、穗粒数(NGS)等关键性状。通过主成分分析(PCA)和Ward聚类解析遗传多样性,并比较XGBoost、MARS和GP三种机器学习算法对收获指数(HI)的预测效能。

主要研究结果

表型多样性解析
定量性状分析揭示显著变异:早熟基因型OTGB 23(DFL=200天)比对照早19天,穗长冠军OTGB 2143(13.4 cm)超出对照18%,高产种质OTGB 135的穗粒数(94.8粒)提升75%。PCA显示前4个主成分贡献72.86%变异,其中穗粒重(SGW)和穗粒数(NGS)对PC1(34.19%)载荷最高,HI主导PC2(18.21%)。

聚类分析与优异性状挖掘
7个聚类群中,第5-7群聚集了最具育种价值的材料:第7群含45份晚熟高产品种,表现为高穗粒数(71.8粒)、大穗(3.5 g)和高千粒重(46.9 g);第6群的82份材料兼具中熟特性与高产潜力(HI达46.73%)。特别值得注意的是,土耳其地方种在多个聚类中均匀分布,印证了农民世代选育形成的广适性。

机器学习模型优化
XGBoost在HI预测中表现最优:测试集RMSE(均方根误差)仅0.137,MAPE(平均绝对百分比误差)0.222%,且R2达0.998。变量重要性分析显示穗粒重(SGW)、穗粒数(NGS)和开花期(DFL)是HI预测三大关键因子。MARS模型进一步揭示:开花早于226天、单株重超过4 g的基因型更可能获得高HI。

结论与展望
该研究首次系统解码了土耳其六棱大麦"沉睡资源"的农艺价值,通过OTGB 193(千粒重64.8 g)等高产品质的鉴定,为抗逆育种提供了珍贵供体材料。建立的"表型组学+机器学习"研究范式,突破了传统育种依赖经验选择的局限,XGBoost模型对HI的精准预测(误差<0.14%)尤其有助于早期世代筛选。

这项工作的深远意义在于:一方面为应对气候变化的"智能育种"提供了可推广的技术路线;另一方面,对地方品种的深度挖掘印证了传统农业系统在生物多样性保护中的关键作用。未来研究可结合多环境测试与基因组分析,进一步揭示这些表型变异背后的分子机制,推动大麦育种进入"预测设计"的新阶段。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号