基于树结构Parzen估计器采样技术的完全自动化陨石坑检测

《Planetary and Space Science》:Fully automated crater detection based on the tree-structured parzen estimator sampler technique

【字体: 时间:2026年02月11日 来源:Planetary and Space Science 1.7

编辑推荐:

  陨石坑检测中提出基于TPE的优化方法,自动调整混合检测器超参数,显著提升小至0.1公里级陨石坑识别精度(mAP@0.5达92.0%),解决传统方法因静态超参数导致的性能不足问题,适用于复杂地形和实时探测场景。

  
作者:Chinmayee Chaini、Vijay Kumar Jha、Kumar Rajnish
印度兰奇Mesra学院计算机科学与工程系

摘要

为了理解行星体的演化过程,高效识别陨石坑至关重要。最初,陨石坑的检测依赖于人工观察,但这存在40%的误差率,不同研究者之间的结果可能存在差异。随后,研究人员开发了基于深度学习(DL)的各种物体检测技术,能够有效检测多尺度陨石坑。然而,研究人员采用了混合物体检测器,通过结合多种框架的优势(如检测头和特征提取器)来执行行星表面的多尺度陨石坑识别。但由于缺乏优化,这些模型的超参数设置往往不够理想,导致过拟合、训练时间延长或检测精度降低。为了进一步提高混合检测器的性能,本研究应用了树结构Parzen估计器(TPE)优化技术,自动调整学习率、锚点比例、批量大小、dropout等关键参数的最佳组合。在陨石坑数据集上,所提出的模型实现了近92.0%的mAP@0.5、90.2%的召回率和94.8%的精确度。这些结果表明,该优化策略在复杂地形条件下(如遮挡区域、噪声区域以及小尺度检测<0.1公里的情况)能够准确识别陨石坑。

引言

陨石坑是大多数行星表面最显著的地形特征之一。为了更好地了解行星表面的物理特性以及撞击率随时间的变化,近几十年来进行了多项探测任务(Wang等人,2022年;Zurek和Smrekar,2007年;Chicarro等人,2004年)。理解大小-频率分布和撞击体种群,以及太阳系中的演化和碰撞事件,对于计算天体的撞击通量至关重要(Kato等人,2010年;Strom等人,2005年;Fassett,2016年)。主要研究撞击坑是为了了解撞击体的能量、弹丸大小和类型、目标表层的机械特性,以及其他影响陨石坑形态的因素,如重力和材料强度(Toyokawa等人,2022年)。此外,这些研究还应用于航天器导航等太空任务(Andolfo等人,2025年)。
从一开始,科学家们就使用人工或视觉方法来识别陨石坑,但这增加了人力成本且容易出错。这种方法主要针对直径15公里或更小的简单陨石坑以及直径大于15公里的复杂陨石坑。从这一过程中提取的陨石坑信息导致了科学家们之间的分歧。因此,尽管小陨石坑是最常见的特征,但由于在全局图像中不可见,它们经常被忽视或未被记录。因此,许多研究人员开发了一系列自动化陨石坑识别算法,用于检测行星表面各种形状和大小的陨石坑。然而,陨石坑检测算法大致分为两类:传统算法和基于深度学习的(DL)算法(Chaini和Jha,2024年)。
传统算法包括霍夫变换(Salamuni?car和Lon?ari?,2010年)、分水岭算法、边缘检测(Emami等人,2015年)、模板匹配、阈值分割、高程剖面(Agarwal等人,2019年)以及机器学习(ML)方法,如决策树、支持向量机(SVM)、贝叶斯网络和多步方法。然而,由于参数固定,这些技术在应对多样化的月球地形时缺乏灵活性,特别是在表面特征复杂和光照变化的情况下表现不佳(Melosh,1997年)。相比之下,深度学习为克服这些限制带来了希望。
深度学习技术已广泛应用于图像处理和计算机视觉任务。图像处理利用计算机器对图像进行非技术性的分析、解释和操作。它可以在从生物医学成像到行星探测任务的各个领域发挥作用。随着更复杂算法的发展,这一技术迅速进步,解决了以前只能通过人工完成的问题。它在遥感领域得到广泛应用,用于高效探索月球表面。有多种深度学习方法用于检测陨石坑,其中一些方法包括You Only Look Once(YOLO)、Faster Region-Convolutional Neural Network(Faster R-CNN)、Deep Convolutional Neural Network(DCNN)以及各种混合检测模型,这些方法取得了较高的准确率,但代价是计算开销较大,不适合实时应用(Liu等人,2019年;Kieffer和Simonds,1980年)。因此,优化模型是必要的,以降低训练成本并提高模型的泛化能力。
在(Chaini等人,2025年)的研究中,作者提出了一个混合物体检测器模型,该模型结合了增强型特征金字塔网络(Aug-FPN)+ Faster R-CNN + 50层残差网络(ResNet-50),以及一致的监督(CS)、软区域兴趣(RoI)选择(SRS)和残差特征增强(RFA),具有多尺度特征聚合能力和经过验证的物体识别准确性。然而,该模型存在一些局限性:
  • 尽管在架构上具有优势,但在检测小而浅的陨石坑时表现不佳,经常无法将其与背景纹理区分开来,这是由于特征放大不足和定位精度差所致。
  • 其超参数设置(如固定的学习率、RoI阈值和特征金字塔网络尺寸)是静态的,无法自动适应陨石坑数据集中的高方差空间尺度和光照变化,从而进一步降低了性能。
  • 模型性能对特定训练参数(如提议数量、非最大值抑制(NMS)阈值和正/负样本比例)敏感,这表明需要动态调整而非手动调节。此外,由于数据集中中等和大型陨石坑的占比过高,导致小型陨石坑的检测不足。
  • 这些局限性凸显了需要一种系统化且完全自动化的超参数优化方法,以降低训练成本和参数数量。在(Ozaki等人,2022年)的研究中,作者提出了一种名为TPE Sampler的新型树结构Parzen估计器,其配置高效、适应性强,非常适合非凸高维空间(如深度学习场景),是优化多尺度检测模型的理想选择。当模型涉及大量超参数和昂贵评估时,这种优化技术非常推荐。本研究将Optuna(一种贝叶斯优化框架)集成到MM Detection训练流程中,利用TPE Sampler结合剪枝技术高效探索超参数空间。它使模型能够自动学习最佳配置,从而在不同大小的陨石坑和成像条件下更好地泛化,显著提升整体检测性能和鲁棒性。本研究的主要贡献包括:
  • 这种优化技术能够高效导航高维超参数空间,显著提高模型在不同陨石坑大小和地形复杂性下的泛化能力,收敛速度比随机或网格搜索方法更快。它消除了试错参数选择的需求,节省了GPU时间,并基于验证损失提前淘汰了无效的尝试。特别是在检测小陨石坑时,mAP@0.5的绝对增益高达7%,因为小陨石坑的特征显著性较低。
  • 通过微调关键超参数(如RoI阈值、学习率(lr)调度、锚点比例和每张图像的提议数量),提高了模型性能,这些参数直接影响提议的精细化和多尺度特征提取。
  • 此外,通过提前终止无希望的尝试,减少了计算开销,实现了资源高效的调整,同时不牺牲模型精度。Optuna与MM Detection的集成具有良好的可重复性和模块化,便于比较、跟踪和部署最佳配置。总体而言,该架构将(Chaini等人,2025年)提出的模型从手动调整的流程转变为数据驱动、性能自适应的系统,获得了更好的检测结果,并能更好地适应月球陨石坑的复杂特性。
  • 全文分为以下几个部分:第2节全面分析了传统使用的物体检测器。第3节提出了现有文献中需要进一步研究的挑战。第4节详细介绍了数据集选择过程。第5节详细描述了优化架构。第6节展示了测试结果,并讨论了所提模型的局限性及其在火星等其他行星表面的应用。最后,第7节总结了本研究并展望了未来工作。

    文献综述

    在包括行星地质研究、探索未知行星区域、探测视觉导航和识别陨石坑等多个领域,发现未知的行星特征至关重要。从一开始,科学家们就使用劳动密集型技术进行检测(Chaini和Jha,2024年)。随着各种机器学习(ML)算法的发展,研究人员利用这些技术根据陨石坑的纹理、形状和其他独特特征来识别它们。

    传统方法的挑战

    陨石坑的尺寸范围很广,从几公里到数百公里不等。特别是对于直径小于1公里的小陨石坑,由于分辨率有限或地面真实数据(或标注数据集)不足,多尺度检测更具挑战性。本研究指出了现有文献中的几个不足之处,需要进一步研究(Chaini和Jha,2024年):
  • 光照和低对比度效应:
  • 数据集

    本节讨论了用于评估检测器泛化能力或可靠性的多源数据集。为了公平评估,本研究使用了(Chaini等人,2025年)论文中使用的数据集。同时,还使用月球数据集和火星数据集(如高分辨率成像科学实验(HiRISE)进行了实验,该数据集提供了火星表面约0.25米/像素的高分辨率图像。

    方法论

    使用Optuna的高级优化算法(如TPE)强调了检查超参数配置的重要性,以便做出明智的决策,确定接下来尝试哪些配置(Ozaki等人,2022年)。然而,超参数是影响模型行为、泛化能力和性能的外部配置。选择正确的超参数至关重要,因为它可能决定模型的性能差异。

    结果与讨论

    为了评估所提出的混合陨石坑检测模型的有效性,本研究使用了标准的物体识别指标。它评估了在不同陨石坑尺寸下准确定位和分类时的假阳性(FP)和假阴性(FN)之间的权衡。首先,它在没有TPE的情况下评估超参数值,然后集成优化技术。接着,找到最佳的关键超参数,如单位、学习率(λ)和α

    结论

    最终,本研究证明了模型稳定性、性能和适应性的显著提升。基于优化的混合检测器模型能够准确识别小尺度(<0.1公里)、中等尺寸的陨石坑(Strom等人,2005年;Fassett,2016年;Toyokawa等人,2022年;Andolfo等人,2025年;Chaini和Jha,2024年;Salamuni?car和Lon?ari?,2010年;Emami等人,2015年;Agarwal等人,2019年;Melosh,1997年;Liu等人,2019年;Kieffer和Simonds,1980年;Chaini等人,2025年;Ozaki等人,2022年;Kim等人,2005年;

    CRediT作者贡献声明

    Chinmayee Chaini:撰写原始草稿、验证、资源准备、方法论设计。
    Vijay Kumar Jha:撰写、审稿与编辑、监督、概念构思。
    Kumar Rajnish:撰写、审稿与编辑、监督。

    资助

    本研究未获得任何公共部门、商业部门或非营利组织的特定资助。

    利益冲突声明

    作者声明没有已知的财务利益冲突或个人关系可能影响本文的研究结果。

    致谢

    这项研究是Birla理工学院Mesra学院计算机科学与遥感系指导教师、研究学者共同努力的结果。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号