APTES:基于深度学习的拟南芥叶片和角果高通量表型性状自动估算系统

《aBIOTECH》:APTES: a high-throughput deep learning–based Arabidopsis phenotypic trait estimation system for individual leaves and siliques

【字体: 时间:2025年11月01日 来源:aBIOTECH 5

编辑推荐:

  本研究针对拟南芥基因型-表型关联研究中的表型精准量化瓶颈,开发了基于深度学习的拟南芥表型性状估算系统APTES。该系统通过改进的Cascade Mask R-CNN和DetectoRS模型实现叶片与角果的实例分割,分别获得0.961和0.942的F1值,可自动提取128个形态指标。利用166个拟南芥种质进行GWAS分析,发现1,042个SNP与18个叶片性状显著相关,并鉴定到染色体3上调控角果数量的候选基因OFT1。该系统为植物功能基因组研究提供了高效精准的分析工具。

  
在植物科学研究中,精确量化表型性状是解析基因功能的关键环节。作为模式植物,拟南芥(Arabidopsis thaliana)因其基因组小、生命周期短等优势,成为研究基因型-表型关联的理想材料。然而,传统人工测量方法存在效率低、主观性强等局限,特别是对叶片和角果等器官的形态指标测量,严重制约了大规模遗传学研究的发展。虽然高通量成像技术解决了数据采集瓶颈,但如何从复杂图像中精准提取器官级表型参数,尤其是实现重叠器官的自动识别与分割,仍是当前植物表型组学领域的核心挑战。
针对这一技术瓶颈,华中农业大学杨万棱团队在《aBIOTECH》发表了题为"APTES: a high-throughput deep learning-based Arabidopsis phenotypic trait estimation system for individual leaves and siliques"的研究论文。该研究开发了一套基于深度学习的拟南芥表型性状自动估算系统APTES,通过整合计算机视觉与深度学习算法,实现了叶片和角果的高精度实例分割与性状提取。
关键技术方法包括:1)基于改进Cascade Mask R-CNN的叶片分割模型,采用ResNeSt主干网络和通用感兴趣区域提取(GRoIE)模块增强特征提取能力;2)优化DetectoRS的角果分割模型,引入组归一化(GN)和权重标准化(WS)提升小批量训练效果;3)利用国际植物表型网络(IPPN)和英国国家植物表型中心提供的公开数据集进行模型训练与验证;4)对166个拟南芥种质进行全基因组关联分析(GWAS),挖掘性状相关遗传位点。

高级模型实现叶片分割与表型性状估算

研究团队通过增强Cascade Mask R-CNN模型,将主干网络从ResNet替换为具有分裂注意力机制的ResNeSt,并结合GRoIE模块优化区域提议网络。在对4,250张增强图像进行训练后,模型在测试集上获得0.965的精确度、0.958的召回率和0.961的F1值。在叶片计数方面,预测值与真实值的平均差异仅为0.758片,叶片面积、长度和宽度等性状的确定系数(R2)介于0.776-0.992之间,平均绝对百分比误差(MAPE)为1.89%-7.90%。

角果分割与表型估算的高级模型

针对角果分割任务,研究团队开发了基于改进DetectoRS的实例分割模型。该模型通过引入GN和WS有效缓解了小批量训练的不利影响,在2,357张增强图像训练后,精确度、召回率和F1值分别达到0.954、0.930和0.942。角果数量、面积、长度和宽度等性状的R2值为0.931-0.976,MAPE为1.89%-7.90%,表明管道具有高精度。

基于APTES表型数据的全基因组关联研究

利用APTES管道对166个拟南芥种质进行表型分析,结合GWAS研究,共发现1,042个单核苷酸多态性(SNP)与18个叶片相关性状显著相关。特别值得注意的是,在染色体3上鉴定到一个与角果数量显著相关的SNP,该位点位于O-岩藻糖基转移酶1(OFT1)基因附近。携带SNP-A的种质比SNP-G种质角果数量更少,这与先前报道的oft1突变体角果发育缺陷表型一致,提示OFT1可能是调控角果数量自然变异的候选基因。

APTES管道的时间效率

在配备NVIDIA RTX 3090 GPU的服务器上,叶片图像平均处理时间为0.15秒/张,角果图像为0.29秒/张。该系统兼容智能手机采集的图像,并能适应不同分辨率的输入数据,展现了在非受控环境下的应用潜力。

与传统方法的比较研究

与Otsu阈值法和K-means聚类等传统方法相比,APTES在复杂背景下表现出显著优势。传统方法常将背景误判为植物组织,或无法区分角果与茎杆,而深度学习模型能精准识别重叠器官。改进后的Cascade Mask R-CNN模型在叶片分割的精确度、召回率和F1值分别比原模型提升约1个百分点;角果分割模型中,改进DetectoRS的精确度和F1值分别提高1%和2个百分点。

APTES的通用性验证

研究团队在三个公共拟南芥数据集(拟南芥全生长数据集、ARADEEPOPSIS和植物表型数据集)上验证了APTES的通用性,即使在低分辨率图像中也能实现精准分割。此外,系统成功应用于百日草、矮牵牛、小白菜和辣椒等其他植物物种的叶片分割,证明其具有较强的跨物种适应性。
本研究开发的APTES系统首次实现了拟南芥叶片和角果的实例级分割,克服了传统语义分割方法在器官水平量化中的局限。通过整合先进的深度学习架构与计算机视觉技术,该系统能够从单一图像中自动提取64个叶片性状和64个角果性状,为高通量植物表型分析提供了新范式。GWAS研究结果验证了该系统在解析复杂性状遗传基础方面的实用性,其中OFT1基因与角果数量的关联为后续功能研究提供了新方向。
尽管APTES在受控实验室条件下表现优异,但作者指出其在田间复杂环境中的适用性仍存在局限。未来工作将聚焦于扩展训练数据集涵盖更多环境条件,整合三维建模技术,并建立形态特征与生化参数的多模态关联,从而深化对表型形成机制的理解。该系统的开源特性(https://drive.google.com/drive/folders/1i9IariilIrxuFtVIaRialzqvb8Gfg3xTc)将促进植物科学界的广泛应用,推动植物表型组学向更精准、高效的方向发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号