
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:整合多组学与机器学习预测豆科植物抗病性
【字体: 大 中 小 】 时间:2025年06月29日 来源:Theoretical and Applied Genetics 4.4
编辑推荐:
这篇综述系统探讨了整合多组学(基因组、转录组、表观组、蛋白质组、代谢组)与机器学习(ML)技术提升豆科植物抗病性预测的潜力。文章强调多组学数据能揭示植物-病原体互作的复杂分子机制(如R基因、QTLs),而ML模型(如随机森林RF、支持向量机SVM)可捕捉非线性关系,加速抗病育种(GS)。作者指出,尽管该策略在主要作物中已有应用,但在豆科(如大豆、鹰嘴豆)中仍需突破基因组狭窄和工具不足的瓶颈。
豆科作物(如大豆Glycine max、鹰嘴豆Cicer arietinum)是全球粮食安全的关键,但其产量常因病害损失10-40%。传统育种依赖单一基因组标记(如SNPs)和线性统计模型,难以解析抗病性的多基因调控网络。多组学技术通过整合转录动态(RNA-seq)、表观修饰(DNA甲基化)、蛋白互作(质谱)和代谢物变化(如防御相关苯丙烷类),为抗病机制提供了全景视角。
基因组学:GWAS和泛基因组分析发现抗病相关等位基因(如鹰嘴豆Foc抗性基因)。例如,大豆泛基因组揭示了野生种中罕见的抗性变异。
转录组学:双物种RNA-seq(宿主-病原体)可识别早期防御响应基因(如WRKY转录因子),其表达模式通过SVM分类器预测病害严重度(准确率72.3%)。
表观组学:病原体感染诱导启动子区CHH去甲基化,激活防御基因(如拟南芥中Pseudomonas响应基因)。
代谢组学:抗性大豆品种中,Phytophthora sojae侵染触发特异性糖类和次级代谢物积累,这些生物标志物在RF模型中权重高于基因组标记。
高维多组学数据需通过三类整合策略处理:
特征选择是关键步骤:
成功案例:
瓶颈:
单细胞空间组学将揭示组织特异性抗病响应,而大语言模型可辅助生成假说。开发用户友好工具(如SoyOmics数据库)帮助育种家平衡抗病性与产量,是实现“育种4.0”的核心。
生物通微信公众号
知名企业招聘