
-
生物通官微
陪你抓住生命科技
跳动的脉搏
"HuGe系统:面向自动驾驶场景的人机协同可控图像生成技术研究"
【字体: 大 中 小 】 时间:2025年08月10日 来源:Visual Informatics 3.9
编辑推荐:
为解决自动驾驶技术中极端天气和罕见场景数据匮乏的问题,研究人员开发了交互式视觉分析系统HuGe。该系统创新性地结合凸优化与扩散模型,实现了半自动化的可控图像生成,支持多维数据集分析和样本评估。案例研究和专家访谈证实,HuGe能有效扩充自动驾驶数据集,提升模型在复杂场景下的可靠性。
自动驾驶技术近年来快速发展,但其安全性仍受限于训练数据的多样性。现实世界中,极端天气、突发障碍物等罕见场景数据难以获取,导致自动驾驶系统在"边角案例"(corner cases)中的表现不佳。传统解决方案如实地采集成本高昂,而仿真数据又存在真实性问题。如何高效生成高质量、可控的自动驾驶场景图像,成为制约技术突破的关键瓶颈。
针对这一挑战,中山大学智能系统工程学院的科研团队在《Visual Informatics》发表了创新性研究成果。他们开发了名为HuGe的交互式视觉分析系统,通过融合传统优化算法与生成式AI技术,实现了人类专家指导下的可控图像生成。该系统不仅能模拟不同天气条件,还能智能插入符合物理规律的障碍物,为自动驾驶模型训练提供了高效的数据增强方案。
研究团队采用了三项核心技术:基于HiDT和CycleGAN的天气转换模型、结合凸优化与CVAE(条件变分自编码器)的半自动目标插入算法,以及基于ResNet的天气强度识别模块。通过深度信息融合和约束优化,系统能生成空间关系合理的场景;而GLIGEN扩散模型则确保了生成物体的真实感。
研究结果显示,在数据可视化方面,HuGe通过热力图、雷达图等多视图联动设计,实现了数据集分布的可视化探索。案例研究证实,系统能有效填补数据空白——在Cityscapes数据集中生成近距离车辆图像后,目标检测模型YOLOv5的mAP(平均精度)从34.8%提升至53.2%。在天气模拟方面,系统支持0-1连续调节的雾、雨、光照参数,生成的极端天气场景得到领域专家认可。
值得注意的是,知识驱动的目标插入方法展现出独特优势。通过深度估计模型ZoeDepth提供的空间信息,结合COBYLA优化算法,系统能自动生成符合透视规律的障碍物位置。例如在居民区场景中添加雨中的奶牛,既保留了环境真实性,又创造了罕见的危险场景。
讨论部分指出,尽管当前生成图像偶现比例失调等问题,但系统已显著降低了数据采集成本。未来通过集成CARLA等仿真器,可进一步提升天气控制的精细度。这项研究的突破性在于:首次将视觉分析框架与生成式AI结合,为自动驾驶数据增强提供了可解释、可交互的解决方案,其技术路线也可拓展至医疗影像等稀缺数据领域。论文中专家访谈反馈强调,该系统"直观易用"的设计显著提升了数据探索效率,为AI模型的可靠性测试开辟了新途径。
生物通微信公众号
知名企业招聘