
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于PID控制器启发的多模态特征增强框架MFEGPT在MLLMs中的应用研究
【字体: 大 中 小 】 时间:2025年07月26日 来源:Neurocomputing 5.5
编辑推荐:
为解决短波红外(SWIR)图像标注数据匮乏制约海洋船舶检测精度的问题,研究人员创新性提出可见光至SWIR的图像转换框架。通过多级损失函数(对抗/像素/块/感知损失)优化生成对抗网络,成功实现跨光谱域特征迁移,生成的合成SWIR图像在船舶检测任务中表现出色,为红外遥感目标检测提供了新范式。
在全球化贸易高度依赖海运的背景下,海洋船舶检测技术对维护航道安全、打击非法活动具有重要意义。然而传统可见光成像受限于恶劣天气条件,而具备全天候监测能力的短波红外(SWIR)成像技术却面临标注数据稀缺的困境——这正是制约深度学习技术在船舶检测领域应用的关键瓶颈。
针对这一挑战,山东大学光学工程专业的Liqian Wang研究团队在《Neurocomputing》发表创新研究,提出基于图像转换范式的解决方案。该团队开发了可见光至SWIR的跨域转换框架,通过生成对抗网络(GAN)结合多级约束机制,成功将丰富的可见光标注数据转化为可用于训练的合成SWIR图像,为突破数据壁垒提供了新思路。
关键技术包括:1)采用双生成器-判别器架构实现VIS-SWIR双向转换;2)设计包含像素级L1损失、块匹配损失和VGG感知损失的多层次优化目标;3)利用新加坡海洋数据集(SMD)和山东大学红外船舶数据集(SDU-IRSD)进行跨域验证。
主要研究发现:
《Marine ship detection》章节证实SWIR成像在雾穿透性和夜间成像方面的独特优势;
《The Framework》详细阐述了生成器GVIS→SWIR和判别器DSWIR的对抗训练过程,通过PatchGAN结构增强局部特征保真度;
《Datasets and Setup》显示合成图像在YOLOv3检测器中达到84.7%的mAP,接近真实SWIR数据85.2%的性能;
《Conclusion》指出该方法首次实现可见光到SWIR的船舶目标特征迁移,为THz、UV等特殊波段成像提供了技术参考。
这项研究的突破性在于:不仅解决了SWIR数据稀缺的行业痛点,更开创了跨光谱域特征迁移的新范式。通过保留原始标注信息的图像转换,研究者成功将可见光数据的丰富性与SWIR成像的物理优势相结合,为复杂气象条件下的海洋监测提供了可靠的技术支撑。相关多级约束机制和特征嵌入方法,对拓展多模态遥感数据处理具有重要指导价值。
生物通微信公众号
知名企业招聘