港口环境下海上城市水域目标跟踪数据集(Maritime Urban Tracking Dataset, MUT)

《Scientific Data》:Maritime urban tracking dataset in harbor environment

【字体: 时间:2026年06月03日 来源:Scientific Data 6.9

编辑推荐:

  海上目标跟踪数据集对于开发和评测算法以支持智能船舶在拥挤水域安全航行至关重要。与拥有KITTI等基准推动进展的汽车领域不同,具备真实标注(ground truth)的海上数据集仍然匮乏。本文介绍了用于自主水面艇(Autonomous Surface Vesse

  
海上目标跟踪数据集对于开发和评测算法以支持智能船舶在拥挤水域安全航行至关重要。与拥有KITTI等基准推动进展的汽车领域不同,具备真实标注(ground truth)的海上数据集仍然匮乏。本文介绍了用于自主水面艇(Autonomous Surface Vessel, ASV)在城市水域感知与跟踪的海上城市跟踪(Maritime Urban Tracking, MUT)数据集。数据采集使用一艘自主渡轮原型车,可用于立体匹配(stereo matching)、光流(optical flow)、同时定位与建图(Simultaneous Localization and Mapping, SLAM)、2D/3D目标检测、水面分割(water segmentation)及目标跟踪。本船(ego-vessel)搭载短基线(short-baseline)与宽基线(wide-baseline)立体相机、激光雷达(Light Detection And Ranging, LiDAR)、实时动态定位(Real-Time Kinematic, RTK)全球导航卫星系统(Global Navigation Satellite System, GNSS)、惯性测量单元(Inertial Measurement Unit, IMU)及偏振立体相机(polarized stereo rig)。部分被跟踪目标配备双GNSS接收机并采用后处理动态定位(Post-Processed Kinematic, PPK)以获取精确的世界坐标系参考轨迹(world-frame reference tracks)。数据集包含19个跟踪场景、8个标定序列、1个建图场景及3个靠泊场景,多数时长约1分钟,相机帧率30 fps,激光雷达10 Hz。数据集公开旨在降低研究门槛并促进创新。
《Scientific Data》论文解读:Maritime Urban Tracking (MUT) Dataset——港口环境海上城市水域目标跟踪数据集
本文由Dalhaug等人发表于《Scientific Data》,介绍了首个结合短/宽基线立体视觉、偏振相机、32线LiDAR与搭载PPK GNSS独立世界坐标系基准轨迹的海上城市水域(urban waters/harbor environment)多传感器目标跟踪公开数据集——MUT(Maritime Urban Tracking Dataset)。现有海上视觉数据集(如Singapore Maritime Dataset、SeaDronesSee)多为单目且缺乏世界坐标系真实标注; inland USV数据集(如USVInland)未聚焦目标跟踪且无PPK GNSS真值;PoLaRIS等虽提供世界坐标系轨迹但源于LiDAR推算而非独立GNSS测量。城市港口水域中目标靠近岸壁与陆地、相互邻近,雷达分辨率不足,LiDAR难以区分目标与岸线,而立体相机可提供高密度纹理与深度信息,但缺少带独立高精度GNSS世界坐标系真值的视觉-激光雷达融合跟踪基准。为此,研究人员基于自主渡轮milliAmpere2采集挪威特隆赫姆(Trondheim)运河场景数据,提供短+宽基线ZED X立体相机、偏振立体rig、Ouster OS1-32 LiDAR、SentiSystems双RTK GNSS/IMU组合导航及运动目标上双/单PPK GNSS接收机,经严格内外参标定与时间同步,产出含19个跟踪序列、8个标定序列、1个建图序列、3个靠泊序列及详细标定参数的多模态数据,填补了视觉-LiDAR海事目标跟踪带独立PPK GNSS世界坐标系真值基准空白,支持2D/3D检测、多目标跟踪(Multiple Object Tracking, MOT)、扩展目标跟踪(Extended Object Tracking, EOT)及传感器融合算法验证。技术验证显示跟踪对比PPK GNSS真值北向RMSE 0.21 m、东向0.19 m、航向7.9°,标定重投影误差单日0.11 px/多日0.28 px,时间同步偏差stereo间0.063 ms、偏振rig 12.0 ms、LiDAR 68.3 ms。
研究人员采用的主要关键技术方法如下:基于自主无人渡轮milliAmpere2平台,搭载短基线(~12 cm)与宽基线(~2 m)两组ZED X全局快门偏振立体相机(30 fps, 1920×1080, H.265压缩后存为jpg)、偏振立体rig(12 Hz, 2048×2448, 12 bit打包为.bytes)、Ouster OS1-32 LiDAR(10 Hz, >180°有效视场)、SentiSystems双RTK GNSS/IMU(100 Hz, 世界系"piren"为北-东-地NED,船体系"vessel"为前-左-上)、被跟踪日游艇与皮划艇分别搭载双GNSS(PPK解算轨迹+航向)与单GNSS(PPK轨迹);通过棋盘与带圆孔ArUco标记标定板进行stereo内外参及LiDAR-相机外参(2D ICP + PnP RANSAC + 手动微调),通过Fast-LIO2里程计与INS轨迹手眼标定求LiDAR-to-INS变换(垂直偏移激光测距固定);所有传感器以GNSS PPS为基准经NTP(RPi至ZED Box)或PTP(偏振rig)或直连ROS(INS/LiDAR)对齐至UTC时间;目标PPK轨迹由RTKLIB前向+后向滤波结合双天线几何约束平滑得到含位置与航向的世界坐标系真值;数据按日期—场景—传感器组织,图像存未校正8 bit jpg,LiDAR/IMU/GNSS存通用格式(csv/bin),附带开源读取代码。
Ferry Prototype Sensor Platform
研究人员使用NTNU的自主客运渡轮原型milliAmpere2采集数据,详细描述各传感器型号与分组安装位置(前置短+宽基线ZED X stereo pair、顶部Ouster OS1-32 LiDAR、艉部SentiSystems INS/GNSS、独立偏振stereo rig),指出RADAR未纳入发布数据集。
Inertial Navigation System(INS/GNSS)
研究人员采用SentiSystems双RTK GNSS+IMU系统,以100 Hz输出本船位姿,定义"vessel"体坐标系与"piren"北-东-地(NED)世界坐标系。
LiDAR
研究人员使用Ouster OS1 32光束激光雷达,水平2048点,10 Hz,因安装遮挡有效水平视场略大于180°,内置IMU可用于标定。
Stereo Cameras
研究人员布置两台ZED X stereo camera于铝制横梁上间距约2 m,单体内基线约12 cm构成短+宽基线组合,全局快门、偏振镜片、30 fps、1920×1080,H.265录制,序列内焦距固定(受自动对焦影响序列间微变)。
Polarization Cameras
研究人员使用独立偏振立体rig,两偏振相机12 Hz采集2048×2448 12 bit原始数据,可获取线偏振度(Degree of Linear Polarization, DoLP)与线偏振角(Angle of Linear Polarization, AoLP),利于水面对比度增强与反光抑制。
GNSS tracks
研究人员在被跟踪目标(首日1艘日游艇装双GNSS天线做PPK+航向,次日日游艇+皮划艇各装单GNSS天线做PPK)记录原始伪距/载波相位,联用挪威测绘局By?sen基准站以RTKLIB默认设置前后向滤波解算厘米级世界坐标系轨迹,双天线几何约束得目标航向用于EOT真值。
Synchronization——Stereo Camera Synchronization / LiDAR and INS/GNSS Synchronization / Polarized Stereo Rig Synchronization
研究人员以GNSS PPS为时间基准:ZED Box通过直连RPi上运行低延迟NTP(RPi自身由GNSS PPS驯服)同步至UTC,测时差约121 μs;INS/GNSS与LiDAR记录于渡轮主机经GNSS驯服NTP同步;偏振rig以自身GNSS PPS驯服主机时钟并通过PTP同步相机,帧间偏移<20 μs、相对UTC<100 μs,示波器验证。各传感器按最近时间戳关联。
Calibration——Stereo Camera Calibration / LiDAR to Camera Calibration / LiDAR to INS Calibration / Polarized Stereo Rig Calibration
研究人员用黑白棋盘(单体黑格边长10.1 cm)标定双stereo间外参;用带直径222 mm圆孔与4个4×4 ArUco标记的铝板(12000×12000 px, 12 px/mm)做LiDAR-相机标定——LiDAR检测圆孔、图像检ArUco、2D ICP拟合板平面得标记3D坐标后PnP RANSAC求解初值再手动微调(远距32线稀疏致旋转不准);LiDAR-to-INS用手眼标定最小化Fast-LIO2里程计轨迹与INS轨迹配准(垂直平移激光测距固定参与优化);偏振rig自行棋盘标定内参、双cam间外参及至stereo cam外参,并公开发布标定序列供二次优化。
Data Records
研究人员将数据集发布于NIRD RDA并提供GitHub读取代码,按采集日(2024-07-17单目标日/2024-07-19多目标日)—序列类型组织;stereo相机原H.265转存未校正8 bit jpg免GPU依赖,偏振存打包.bytes,其余LiDAR/IMU/INS/PPK GNSS存csv或bin通用格式;明确定义坐标约定——相机光心系x右y下z前,LiDAR系z向上,"piren"为NED,"vessel"为前-左-上,齐次变换记为Hsrlpl将偏振左相机系点变换至右stereo左相机系。
Data Overview——The Inser Scene / Calibration / Reference Tracks
数据采集于挪威特隆赫姆Bratt?ra运河(宽70–100 m,遮蔽浪小,多云/晴无雨),含19个跟踪、8个标定、1个建图(延伸运河)、3个靠泊场景并附目标尺寸草图(日游艇前后双GNSS天线位/中部单GNSS位,皮划艇中部单GNSS位)供EOT几何建模;提供手动卷尺测传感器安装距供校验;PPK GNSS经平滑与天线几何约束输出目标特定参考点世界坐标及航向,支持带航向真值的扩展目标跟踪评估。
Technical Validation
研究人员从三方面验证:(1)跟踪——对比stereo/LiDAR跟踪输出与PPK GNSS真值得位置北向RMSE 0.21 m、东向0.19 m、航向7.9°、北向速度0.28 m/s、东向速度0.34 m/s、航向角速度3.93 °/s;(2)标定——重投影误差单目标日0.11 px、多目标日0.28 px(OpenCV),关键传感器间距标定值与手动卷尺测量吻合;(3)同步——以左stereo为参考,右stereo时差0.063 ms、偏振rig 12.0 ms、LiDAR 68.3 ms(受帧率与触发对齐限制),并人工核验跨传感器事件一致性,视觉抽检无系统性错位。
讨论与结论
研究人员指出MUT数据集是迄今首个结合短/宽基线立体视觉、偏振立体成像、LiDAR与独立PPK GNSS世界坐标系参考轨迹(含双天线航向真值)的港口/城市水域海上多传感器目标跟踪公开基准。相比仅从LiDAR推算轨迹或缺失PPK GNSS真值的已有海事数据集,MUT可支持算法在目标近岸、近自船、相互邻近复杂场景下与高精度独立世界系真值比对,适用于评测基于视觉-LiDAR的2D/3D目标检测、多目标跟踪(MOT)、扩展目标跟踪(EOT)、立体匹配、光流、水面分割及SLAM等任务。数据集附带详细传感器标定参数、标定序列与读取代码,允许研究者复现或进一步优化标定,降低海上自主感知算法研发对实体平台的依赖,预期推动海事计算机视觉(Maritime Computer Vision, MaCVi)与自主水面艇(ASV)感知领域发展。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号