
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于深度神经网络的图像分类器可解释性新方法:属性引导相关性传播(ARP)技术
【字体: 大 中 小 】 时间:2025年05月07日 来源:Computer Vision and Image Understanding 4.3
编辑推荐:
为解决深度神经网络(DNN)黑箱问题,研究人员提出属性引导相关性传播(ARP)方法,通过从预训练分类器中学习属性信息并整合至显著性图,显著提升模型可解释性。研究结合层间相关性传播(LRP)算法和正向-正向(FF)训练策略,在ResNet-50和ViT等模型上验证了ARP在定位关键区域和提供示例图像方面的优势,为AI决策透明化提供新思路。
在人工智能蓬勃发展的今天,深度神经网络(DNN)虽在图像分类等领域表现卓越,却因复杂的内部机制被称为"黑箱"。这种不可解释性严重制约了其在医疗诊断、自动驾驶等关键领域的应用。传统解释方法如梯度加权类激活图(Grad-CAM)和层间相关性传播(LRP)虽能生成显著性图,但存在噪声干扰大、无法揭示深层语义等问题。如何让AI的决策过程像人类一样透明可理解,成为制约技术落地的关键瓶颈。
针对这一挑战,某大学的研究团队在《Computer Vision and Image Understanding》发表创新成果,提出属性引导相关性传播(ARP)方法。该方法通过三个关键技术突破:1) 在预训练分类器的特定层添加可训练属性层,采用正向-正向(FF)算法进行层间独立训练;2) 引入固有类别模式(ICP)增强类间区分度;3) 构建属性嵌入空间实现关键区域与训练样本的匹配。研究使用CUB-200-2011和ImageNet数据集,在VGG-16、ResNet-50、ConvNeXt和ViT等模型上验证效果。
研究结果部分,通过四个维度系统验证了ARP的优越性:
在指向性游戏测试中,ARP-LRP组合在CUB数据集上达到61.96%的AUC值,较基础LRP提升9.11个百分点。特别是对于非类别判别性的原始LRP算法,ARP使其显著性图获得类间区分能力。
扰动实验显示,ARP-CLRP在ImageNet数据集上取得90.92%的LeRF分数和59.78%的MoRF分数,证明其能准确识别对分类真正关键的像素区域。当逐步扰动非关键像素时,模型准确率保持稳定;而扰动ARP标识的关键区域则导致性能急剧下降。
分割任务评估表明,ARP在像素精度(PA)、平均精度(mAP)和平均交并比(mIoU)三项指标上全面领先。以ConvNeXt-S为例,ARP使mIoU达到0.606,较最优基线提升3.1%,显示其像素级定位的精确性。
典型案例分析揭示,ARP能有效过滤背景干扰。对于"角海雀"图像,传统方法将树枝误判为相关特征,而ARP准确聚焦鸟类本体;面对"镜面倒影"等复杂场景,ARP成功区分实体与倒影,这是现有方法未能实现的突破。
该研究的创新价值体现在三方面:首先,ARP首次实现了解释过程中多层次语义属性的自动挖掘与融合;其次,通过提供与显著性区域相关的训练样本,建立了从"可视化"到"可理解"的完整解释链条;最后,方法具有架构普适性,可扩展至Transformer等新型网络。这些突破为医疗影像分析、工业质检等需要高可靠性解释的场景提供了新工具,标志着可解释AI从"粗粒度定位"迈向"细粒度语义解释"的新阶段。未来通过优化属性多样性策略和计算效率,ARP有望成为深度学习模型的标准解释模块。
生物通微信公众号
知名企业招聘