
-
生物通官微
陪你抓住生命科技
跳动的脉搏
跨域小样本三维点云语义分割:基于CAD模型与RGB-D数据的创新方法
【字体: 大 中 小 】 时间:2025年07月19日 来源:Pattern Recognition Letters 3.9
编辑推荐:
针对三维点云语义分割中标注成本高、跨域适应性差的问题,研究人员提出跨域小样本三维点云语义分割(3D CD-FS-SSeg)任务,通过融合CAD对象模型与RGB-D支持数据,开发了跨域适配模块(CDA)和多原型判别损失(MPD),在ScanNet和S3DIS数据集上实现显著性能提升,为低成本扩展三维场景理解能力提供新范式。
三维点云语义分割是计算机视觉领域的重要任务,在增强现实、自动驾驶等场景中具有广泛应用前景。然而,现有方法面临两大瓶颈:一是依赖大量标注数据,而三维场景标注成本极高;二是难以快速适应新类别,每次新增类别都需重新采集标注数据。传统全监督方法如DGCNN虽性能优异,但扩展性受限。为此,研究者提出小样本三维点云语义分割(3D FS-SSeg),利用少量标注样本实现新类别分割,但仍需标注三维场景作为支持集,实际应用仍存障碍。
针对这一挑战,中国科学院计算技术研究所(Institute of Computing Technology, Chinese Academy of Sciences)的Jiwei Xiao等人在《Pattern Recognition Letters》发表研究,提出更具实用性的跨域小样本三维点云语义分割(3D CD-FS-SSeg)任务。该工作创新性地采用低成本CAD模型或RGB-D图像作为支持集,通过跨域特征适配和原型优化,显著降低对标注数据的依赖。
关键技术包括:1)跨域适配模块(Cross Domain Adaptation, CDA),采用多头交叉注意力机制对齐对象模型与场景特征;2)多原型判别损失(Multiple Prototypes Discriminative, MPD),通过最大化类间差异、最小化类内差异提升原型区分度;3)基于DGCNN的 episodic 训练策略,利用ModelNet和SUN RGB-D构建跨域支持集。
主要研究结果
结论与意义
该研究首次实现从对象模型到场景点云的跨域知识迁移,提出的CDA模块和MPD损失为小样本三维理解提供新思路。通过利用现有CAD/RGB-D数据,大幅降低新类别扩展成本,对机器人环境交互、智能驾驶等需快速适应新场景的应用具有重要价值。未来可进一步探索多模态支持集融合与动态原型优化方向。
(注:全文依据原文内容撰写,未添加非原文信息;技术术语如DGCNN、mIoU等均保留原文格式;机构名称按国内惯例翻译;实验数据均引自原文结果部分)
生物通微信公众号
知名企业招聘