OneRosette:基于视觉基础模型的单样本提示学习实现拟南芥病斑时序图像精准分割

【字体: 时间:2025年10月11日 来源:Plant Methods 4.4

编辑推荐:

  本研究针对自然土壤环境下拟南芥病斑分割需大量标注数据的瓶颈,开发了OneRosette单样本学习流程。该方法基于SAM v2视觉基础模型,仅需单张标注图像即可实现拟南芥与Pseudomonas syringae pv. tomato DC3000(Pst)及Ralstonia pseudosolanacearum(Rps)互作时序图像的精准分割,Dice系数分别达0.977和0.966。通过形态学、颜色和纹理特征提取,成功实现病害早期检测(感染后首时间点p=1.83E-8)和病程定量追踪(与人工标注疾病指数相关性r=-0.928),为植物-病原互作研究提供高效计算表型工具。

  
在植物病理学研究领域,拟南芥(Arabidopsis thaliana)作为模式生物发挥着不可替代的作用,其与丁香假单胞菌番茄致病变种(Pseudomonas syringae pv. tomato DC3000, Pst)的互作系统更是研究植物-病原相互作用的经典模型。然而,当研究场景从实验室控制的理想环境转向更接近自然状态的土壤栽培时,科学家们面临着一个严峻挑战:如何对生长在复杂背景下的患病植物进行准确图像分割?传统方法需要为每种新病原菌人工标注数百张图像并训练专用模型,这种高成本、低效率的操作严重制约了高通量表型分析的应用。
更棘手的是,随着感染进程的推进,病斑区域与土壤背景的颜色、纹理特征会逐渐趋同——早期水浸状斑块(图1b)发展为褐绿相间的坏死症状(图1c),而花盆中的苔藓和藻类也在不断生长,这种动态变化使得传统分割方法的性能急剧下降。现有技术多采用离体叶片在均匀背景下进行研究,虽简化了分割任务,却无法反映完整植株的真实病理反应,且观察时间受限。AraDQ等整体植株表型平台虽有所进步,但仍需1996张标注图像训练模型,且仅限于离体培养条件。这些限制促使研究人员寻找更智能、更灵活的解决方案。
在此背景下,Felicia Maviane Macia等研究人员在《Plant Methods》上发表了创新性研究,提出名为OneRosette的新型分割流程。该方法巧妙利用视觉基础模型Segment Anything Model v2(SAM v2)的零样本学习能力,仅需单张标注图像即可实现整个感染时序的精准分割,打破了"每病原一模型"的传统范式。研究团队通过两个独立的细菌病原体实验(Pst和Rps)验证了方法的通用性,不仅实现了像素级的高精度分割,更成功应用于病害早期检测和病程进展定量分析,为植物病理学研究提供了强有力的计算工具。
关键技术方法主要包括:基于Hough圆检测的盆栽图像自动裁剪、多色彩空间阈值分割的像素分类、SLIC超像素生成与难接近点提取的提示选择策略、SAM v2模型的迭代掩码预测与时序传播机制。研究样本来源于PHENOPSIS自动化生长舱培养的拟南芥哥伦比亚生态型(Col-0)植株,分别通过喷雾接种(Pst实验,144株)和灌根接种(Rps实验,144株)方式建立病理模型,图像采集时间跨度达14-22天。
像素级验证结果
通过网格搜索和5折交叉验证优化超参数,最佳组合为百分位数q=0.005、植物提示点128个、背景提示点256个,在Pst分割测试集上获得Dice分数0.9803±0.0008和IoU分数0.9615±0.0015。与U-Net模型对比显示,OneRosette在仅使用单张标注图像训练的情况下,分割性能与使用完整数据集(476张图像)训练的U-Net相当(Dice: 0.977 vs 0.979),而训练时间缩短35倍。当应用于未见过的Rps病原体时,OneRosette无需微调即获得0.966的Dice分数,显著优于U-Net模型的性能下降表现(Dice从0.979降至0.956),证明其强大的跨病原体泛化能力。
视觉对比显示(图13),OneRosette对晚期症状植株的分割效果最佳,能准确识别褐变叶片且避免误判苔藓区域,而U-Net模型出现明显过分割或欠分割现象。特别是在Rps感染晚期样本中(图14),OneRosette(图14c)几乎完整保留所有病叶轮廓,而U-Net模型(图14d-f)出现大量叶片缺失或背景误判。
时间序列级验证结果
Pst定性分析
通过自助采样法从37个特征中筛选最佳判别变量,灰度共生矩阵(GLCM)同质性(homogeneity)以71%出现率成为最敏感指标(表10)。该指标反映相邻像素间对比度,其下降与水浸状病斑的出现高度相关。ANOVA分析显示(表11),在感染后首个采集时间点(D21-15h)即检测到处理组与对照组的显著差异(p=1.83E-8),此时专家视觉标注仅发现不足50%植株出现症状(图9),证明方法较人工观察更具敏感性。
同质性指标随时间变化曲线(图15)清晰显示,感染组从D21-15h开始持续低于对照组,与病斑扩展规律一致。托盘位置虽产生显著影响(p=0.01-0.04),但F统计量远低于处理组,且无交互作用,证明环境异质性不影响结论可靠性。
Rps定量分析
Lab色彩空间b通道均值(代表蓝黄对比度)以50.3%出现率成为最佳病程指标(表12),与叶片黄化症状发展相符。ANOVA分析显示(图16c),在D31-13h(感染后52小时)首次出现显著差异(p=2.8E-3),此时平均病害指数尚低于1.0。该变量与人工标注病害指数高度相关(r=-0.928, p<2.2E-16),能准确反映从萎蔫(指数1)到整体黄化(指数4)的全病程进展(图16a-b)。
讨论与结论
本研究开发的OneRosette流程成功解决了自然土壤环境下拟南芥病斑时序分割的三大核心难题:标注数据依赖性强、病原体特异性高、复杂背景干扰大。其创新性体现在四个方面:首先,单样本学习机制将标注成本降低两个数量级;其次,视觉基础模型的零样本迁移能力实现跨病原体应用(Pst→Rps)无需微调;第三,时序追踪功能克服了动态背景干扰;最后,多特征提取框架为病理表型分析提供丰富量化维度。
方法在Pst和Rps两种症状迥异的细菌病原体上均表现优异,暗示其可能适用于更广泛的病原类型,如真菌(核盘菌Sclerotinia sclerotiorum)或病毒(芜菁花叶病毒TuMV)。未来通过增加深度信息采集、优化小孔洞分割算法、扩展多植株追踪功能,有望进一步应用于田间无人机表型分析。
局限性包括对重叠邻株叶片的误追踪、早期形态症状(如Rps指数1萎蔫)检测灵敏度不足等。这些可通过后处理算法和多变量融合策略加以改进。值得注意的是,与需要1996张标注图像的AraDQ平台相比,OneRosette在保持精度的同时极大提升了可用性,使长期自然栽培条件下的病理学研究成为可能。
这项研究为植物-病原互作机制研究提供了强有力的技术支撑,其低计算需求、易迁移特性尤其适合资源有限的研究团队。通过将深度学习与视觉基础模型相结合,OneRosette不仅实现了技术突破,更开辟了高通量植物表型分析的新范式——从专用模型走向通用工具,从理想环境走向真实世界,为作物抗病育种和精准农业奠定了方法学基础。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号