
-
生物通官微
陪你抓住生命科技
跳动的脉搏
面向AI研究的可见光-短波红外-长波红外三波段车辆与船舶数据集构建与应用
【字体: 大 中 小 】 时间:2025年04月11日 来源:Scientific Data 5.8
编辑推荐:
编辑推荐:针对多波段目标检测中单波段数据局限性及时间/视场同步难题,山东大学团队构建了首个公开的三波段(VIS/SWIR/LWIR)车辆船舶数据集,通过YOLOv8和SSD算法验证(mAP50>0.8),并实现基于小波变换的多波段图像融合,为自动驾驶、船舶监控及多模态感知研究提供关键数据支撑。
针对这一瓶颈,山东大学激光与红外系统教育部重点实验室的研究团队在《Scientific Data》发表了首个公开的三波段光学图像数据集。该研究通过精密设计的采集系统(含VIS/SWIR/LWIR三波段相机)和创新的数据处理流程,构建了包含2,769张车辆图像和1,350张船舶图像的数据集,其核心突破在于实现了亚毫秒级时间同步与0.001°视场对齐精度。研究采用YOLOv8和SSD算法验证,模型mAP50最高达0.97,并通过小波变换(wavelet fusion)首次展示了三波段数据在细节互补上的独特优势——例如在逆光场景中,SWIR波段成功弥补了VIS成像的失效区域。
【关键技术方法包括:1) 定制化三相机同步采集系统,通过双轴云台实现视场中心对齐;2) 基于DFOV(对角视场角)公式的镜头组优化设计,开发SET_F/SET_N两套适配不同距离的镜头组合;3) 帧提取与同步算法,以20帧间隔采样保证特征多样性;4) Roboflow工具进行YOLO格式标注;5) 基于PyTorch框架的深度学习模型训练与验证。
生物通微信公众号
知名企业招聘