基于部分信息分解的深度神经网络性能解释:一种面向鲁棒性评估的新范式

《Entropy》:Interpreting Performance of Deep Neural Networks with Partial Information Decomposition

【字体: 时间:2026年01月02日 来源:Entropy 2

编辑推荐:

  本文提出了一种基于部分信息分解(PID)的深度神经网络(DNN)鲁棒性解释框架。通过量化神经元间冗余(Redundancy)、协同(Synergy)和独特(Unique)信息,揭示了模型内部信息结构与抗分布偏移能力的内在关联:高冗余率与低协同率模型在自然扰动下表现更稳定,而高独特信息率则与原始数据分类精度正相关。该研究为无需大量污染数据即可进行轻量级鲁棒性评估提供了新视角。

  

1. 引言

深度神经网络(DNN)在图像识别、推荐系统和自然语言处理等领域取得了显著成功,但其性能严重依赖于训练数据的分布,使其在面对训练域与测试域之间的分布偏移时显得脆弱。这一问题在自动驾驶等安全关键应用中尤为突出,复杂动态环境引入的自然扰动(如光照变化、恶劣天气、图像模糊等)会严重损害视觉感知模型。尽管通过数据增强(如添加污染样本)可以在一定程度上提升鲁棒性,但往往会导致对已见污染类型的过拟合,限制了对未见退化模式的泛化能力。
现有的鲁棒性评估方法主要依赖于在污染基准数据集上评估模型性能退化,或通过输出波动和置信度变化来量化敏感性。这些方法通常需要大量污染数据且计算成本高昂,更重要的是,它们基于后验观察,难以揭示模型内部信息结构与鲁棒性之间的内在联系。
信息论方法为理解DNN提供了理论框架。信息瓶颈(Information Bottleneck, IB)理论将深度学习视为输入压缩与任务相关信息保留之间的权衡。部分信息分解(Partial Information Decomposition, PID)作为IB的细化,将多元互信息分解为冗余、协同和独特成分,能够深入揭示神经元如何共享、整合和专门化信息。PID已在生物和人工神经系统中得到应用,例如用于绘制大脑信息架构和分析玻尔兹曼机中的隐藏神经元表征。前期研究多集中于小规模网络,本研究旨在将PID框架扩展到复杂架构和现实任务中,探究神经元信息交互结构与模型鲁棒性的关系。

2. 部分信息分解

信息论中,互信息(Mutual Information, MI)是衡量两个随机变量之间依赖关系的基本指标。对于离散随机变量X和Y,互信息定义为联合概率分布与边缘概率分布乘积之比的对数期望。它也可以表示为熵的形式:I(X;Y) = H(Y) - H(Y|X),其中H(Y)是Y的香农熵,H(Y|X)是给定X条件下Y的条件熵。互信息衡量了已知X后Y的不确定性减少量。
然而,在多变量设置中,互信息无法区分多个源变量对目标变量的不同贡献类型,例如它们是提供冗余的、独特的还是协同的信息。为解决这一局限,Williams和Beer提出的PID框架将总互信息分解为以下基本成分:
  • 冗余信息:由多个源变量共享的信息,即关于目标Y的相同信息可由多个源提供。
  • 独特信息:由单个源变量独家提供的信息,无法从其他任何源获得。
  • 协同信息:只能通过多个源变量的联合考虑才能获得的信息,无法从任何单个源单独获取。
以两个源变量X1和X2及目标变量Y的简化情况为例,PID将联合互信息I(X1,X2;Y)分解为冗余信息R(X1,X2;Y)、X1的独特信息U(X1;Y)、X2的独特信息U(X2;Y)以及协同信息S(X1,X2;Y)之和。同时,单个源与目标的互信息I(X1;Y)等于冗余信息与X1的独特信息之和,I(X2;Y)同理。这构成了一个包含四个未知数的三个方程的系统。
PID提供了一个概念框架,但并未规定计算这些量的具体方法。本研究出于计算可行性的考虑,采用Imin度量来计算冗余函数,即R(X1,X2;Y) = min(I(X1;Y), I(X2;Y))。

3. 方法

3.1. 数据集和模型

本研究选用CIFAR10和ImageNet数据集进行实验。为评估模型在噪声和退化条件下的性能,使用了ImageNet-C和CIFAR10-C污染基准数据集,它们模拟了常见的真实世界退化类型,包括噪声、模糊、天气和数字失真四大类,每类选取两种具体污染类型(如椒盐噪声、高斯噪声、运动模糊、散焦模糊、雪、雾、像素化和对比度变化),每种污染包含1到4共四个严重级别。原始未污染图像被视为严重级别0。
研究选取了六种具有不同架构的卷积神经网络进行分析:MobileNet V2、AlexNet、VGG 16、Inception V3、ResNet 50和DenseNet 121。所有模型均使用PyTorch 2.9.1提供的预训练权重初始化,并未在任何污染数据上进行微调。

3.2. 污染鲁棒性

为评估模型在图像污染下的稳定性,本研究采用平均污染精度(mCA)、精度标准差(σAcc)和相对精度退化(ΔAcc)三个指标。mCA是模型在所有选定污染类型和严重级别(1至4)上的平均分类精度。σAcc是模型在干净数据(s=0)和所有污染条件(s=1-4, c∈C)下精度的标准差,用于衡量性能在不同评估条件下的离散程度。ΔAcc衡量了污染下性能相对于干净数据的下降幅度,计算公式为(mCA - A0f)/A0f

3.3. PID的计算

为探究神经元信息交互与模型性能的关系,对从各模型测试数据集获得的神经元激活进行PID分析。源变量定义为给定网络层内的神经元集合,具体选择每个模型的最后一个池化层中的神经元,因为该层捕获了对最终决策至关重要的高级语义表征。目标变量定义为每个输入对应的真实类别标签。
考虑到全阶PID计算在神经元数量较大时计算不可行,且已有研究表明二阶PID与全阶PID在定性行为上一致,本研究采用二阶PID分析(PID-2)并结合均匀采样策略来近似计算。首先,将神经元的连续激活值通过等宽分箱(10个区间)离散化,以估计概率分布。然后,计算单个神经元激活Xi与类别标签Y的互信息I(Xi;Y),以及采样神经元对(Xi, Xj)与Y的联合互信息I(Xi, Xj;Y)。接着,根据PID方程和Imin冗余函数,将联合信息分解为冗余信息R(Xi, Xj;Y)、协同信息S(Xi, Xj;Y)以及独特信息U1(Xi;Y)和U2(Xj;Y)。最后,将分解得到的信息量归一化,得到冗余率(RR)、协同率(SR)和独特率(UR)等相对度量,以确保跨模型和污染类型的可比性。

4. 结果

4.1. 神经元PID结构与模型鲁棒性关联的初步观察

通过比较不同模型在ImageNet-C和CIFAR10-C上的分类精度及其标准差σAcc,以及在干净图像(s=0)上计算得到的PID度量(RR, SR, UR),发现初步规律:σAcc较小的模型倾向于表现出更高的RR和更低的SR值,而UR则未呈现一致趋势。这为神经元内部信息结构与模型在污染下的鲁棒性可能存在关联提供了初步证据。

4.2. PID度量与鲁棒性的秩相关分析

为进一步评估上述趋势的统计有效性,进行了Spearman的ρ和Kendall的τ非参数秩相关分析,以量化PID度量(RR, SR, UR)与鲁棒性度量(mCA, σAcc, ΔAcc)之间的关系。
结果显示,RR与σAcc存在强烈的负相关关系,在两个数据集上Spearman的ρ和Kendall的τ均达到-1且p值小于0.01。这表明具有更高冗余度的模型在不同污染类型和严重程度下表现出更小的性能波动。这种现象可归因于神经网络中冗余的容错特性。当多个神经元传递重叠信息时,即使部分神经元受到噪声或失真干扰,未受影响的神经元也能补偿损失,从而维持系统整体稳定性。
SR在两个数据集上都与模型鲁棒性呈负相关。具体而言,具有较高SR的模型在不同类型和严重程度的污染下表现出更大的精度波动。这是因为严重依赖协同表征的神经元对输入扰动更敏感。协同信息产生于多个源的联合活动,对其中任何一个源的干扰都可能破坏共享信息的完整性,从而影响模型的决策性能。
UR与mCA呈强正相关,但在CIFAR10-C数据集上统计显著性较弱。UR与ΔAcc的相关性在ImageNet-C上显著,在CIFAR10-C上不显著。UR与σAcc的相关性在两个数据集上均不显著。这表明UR与鲁棒性指标的关联在不同数据集间不一致,UR可能更多地参与任务特异性特征表征,而在通用鲁棒性机制中作用相对有限。
不同模型在RR和SR上的差异可追溯至其架构设计。ResNet50和DenseNet121 consistently表现出更高的RR和更低的SR,这归因于其跳跃连接和密集特征复用设计,促进了重叠信息通路。相反,AlexNet和MobileNetV2显示出较低的RR和较高的SR,表明其相对浅层或轻量的卷积结构更依赖于联合特征整合,从而对污染引起的扰动更敏感。InceptionV3表现出中等的RR和最低的SR,其多分支架构促进了表征多样性同时最小化了对协同编码的依赖。VGG16则处于中间范围。这些观察结果突显了冗余率和协同率反映了架构设计选择。

4.3. 独特信息与分类性能的联系

进一步研究了信息交互模式与不同污染条件下分类性能的关系。通过评估模型在干净图像(s=0)和轻度污染图像(s=1)上的性能并计算PID度量,发现达到较高精度的模型通常表现出较高的UR值,这表明独特信息可能反映了模型提取判别性特征的能力。
然而,随着污染严重程度的增加,这种趋势减弱。在s=3和s=4的严重污染水平下,所有模型的分类性能显著下降,UR的差异变得无序。此时,严重的失真淹没了有用信号,模糊了与UR的相关性。这意味着UR可能在高质量输入条件下作为模型能力的有效结构指标,而在严重污染下,模型可能更依赖于冗余机制或其他鲁棒性策略来维持性能。
为了进一步检验独特信息在分类任务中的判别能力,比较了正确分类样本和错误分类样本之间的UR。结果显示,对于从s=1到s=4的污染水平,正确分类的输入 consistently 表现出比错误分类样本更高的UR值。这种效应在轻度污染条件下尤为明显,支持了独特信息增加与判别能力提高相关的推断。
从理论上看,Tax等人对玻尔兹曼机训练过程中神经信息动力学的分析表明,神经元首先获取冗余信息,然后逐渐专门化以编码关于目标变量的独特信息。这种转变反映了捕获判别性特征能力的增强。从统计决策理论的角度,Venkatesh等人证明独特信息的量提供了给定信息源在决策任务中可实现的最小风险的上界。因此,UR与分类性能的正相关关系得到了实证和理论的双重支持。
UR同样反映了架构设计。InceptionV3、ResNet50和DenseNet121 consistently显示出较高的UR,表明多分支、残差和密集连接促进了特征专门化和判别能力。MobileNetV2表现出中等的UR,平衡了效率与适度独特性。相比之下,VGG16和AlexNet显示出较低的UR,与其更依赖共享表征的顺序或浅层结构一致。

5. 结论

在PID框架内,本研究检验了神经元信息交互结构作为模型鲁棒性潜在指标的价值。通过分析源自干净图像神经元激活的PID度量,探索了内部信息交互机制与模型在污染下鲁棒性之间的关系。这种方法促进了一种不依赖于大量污染测试样本的新型鲁棒性评估范式的形成。
在ImageNet-C和CIFAR10-C数据集上的实验揭示了信息分解与鲁棒性关联的一致趋势。具有较高冗余率的模型倾向于在多样污染类型和严重级别上获得更稳定的性能,而较高的协同率通常与增加的性能可变性相关。这些结果表明冗余通过支持对输入退化的容错能力而对鲁棒性做出关键贡献,而更大程度地依赖协同信息可能提高对噪声和扰动的敏感性。此外,独特信息率与高质量输入下的分类性能相关,表明独特信息反映了编码判别性特征的专门化程度。然而,随着污染严重性增加,独特信息的影响减弱,网络越来越依赖冗余来保持性能。
总体而言,本研究结果突显了PID中各组成部分的独特功能角色:冗余对鲁棒性至关重要,协同有助于复杂特征整合但引入敏感性,独特性在高质量输入条件下有助于精度。未来的研究应进一步探索调节神经模型信息结构的策略,以在鲁棒性和准确性之间取得更好的平衡。例如,可以开发特定的架构设计或训练程序来增强冗余,从而提高在挑战性条件下的稳定性。此外,识别在不损害鲁棒性的前提下促进独特信息学习的方法,可能是构建更可解释神经网络的一个有前景的方向。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号