三维植物分割新突破:2D-to-3D重投影方法与前沿3D算法的性能对比研究

【字体: 时间:2025年04月22日 来源:Biosystems Engineering 4.4

编辑推荐:

  针对3D植物表型分析中分割精度不足的难题,本研究创新性地开发了基于2D-to-3D重投影的分割方法,并与Swin3D-s、PTv3等前沿算法对比。结果表明,该方法仅需5株标注样本即可达到25株训练样本的3D算法性能,且通过虚拟相机可将IoUmacro提升至0.81,为植物器官精准测量提供了高效解决方案。

  

在农业育种和植物科学研究中,精确测量植物器官的三维结构对理解基因型-环境互作至关重要。然而,传统手工测量效率低下且易产生误差,而现有3D分割算法面临标注数据稀缺、预训练模型不足等挑战。尤其对于番茄等复杂植株,区分主茎(main stem)与侧枝(side stem)等相似结构更是难点。荷兰瓦赫宁根大学的研究团队在《Biosystems Engineering》发表论文,系统比较了2D-to-3D重投影方法与Swin3D-s、PTv3等前沿3D算法在番茄点云分割中的表现,为解决这一瓶颈问题提供了新思路。

研究采用多视角立体视觉(MVS)重建的44株番茄点云数据集,通过Mask2Former实现2D图像分割,并开发了基于多数投票的3D重投影算法。关键技术包括:1)基于球面旋转算法的点云网格化渲染;2)降低图像分辨率四倍以优化遮挡检测;3)八叉树插值填补未标注点;4)采用Swin-tiny骨干网络处理1080×1920原生分辨率图像。对比实验涵盖MinkUNet34C、Swin3D-s和PTv3三种架构,评估指标包括IoUmacro和IoUmicro

3.1 算法性能对比
Swin3D-s以0.79的IoUmacro略优于2D-to-3D方法(0.78),但统计无显著性差异(p=0.06)。关键发现是传统CNN架构MinkUNet34C性能落后0.18,凸显Transformer架构在3D分割中的优势。值得注意的是,2D方法在叶片分割中因点云缺失导致1.4%背景误判,但通过虚拟相机补充视角可提升性能。

3.2 渲染图像可行性
使用球面旋转算法生成的渲染图像训练模型时,IoUmacro保持0.78不变。这一结果为LiDAR等非图像重建系统的应用铺平道路,证明合成数据可替代真实图像标注。

3.3 训练效率优势
2D-to-3D方法仅需5株标注样本即达到Swin3D-s训练25株的效果(p<0.05)。通过3D标注自动生成2D标签的策略,使单株标注时间从4小时/图像降至4分钟/图像,大幅提升效率。

3.4 多视角增强
将相机数量从15台增至25台(含虚拟相机)时,IoUmacro提升至0.81,超过Swin3D-s基线。这表明增加视角能有效缓解遮挡问题,但需权衡计算成本。

讨论部分指出,当前限制主要来自体素空间不足导致的点云缺失。研究创新性地提出:1)2D与3D方法性能差距随Transformer架构发展已消失;2)3D标注可高效衍生2D训练数据;3)虚拟视角能突破物理相机限制。未来建议结合双向投影网络(BPnet)等混合架构,并在更大数据集中验证。该工作为植物表型分析提供了兼顾精度与效率的解决方案,尤其对茎秆形态等精细结构测量具有重要应用价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号