人工神经网络的可解释抽象表征预测人类信息采集中行为及神经活动

《Nature Neuroscience》：Interpretable abstractions of artificial neural networks predict behavior and neural activity during human information gathering

【字体：大中小】 时间：2026年06月27日 来源：Nature Neuroscience 20.3

编辑推荐：

　　摘要：人类及其他动物具有获取环境中有关机会信息的驱动力，但其如何评估何种信息值得学习仍不清楚。本研究结合人工神经网络（Artificial Neural Network, ANN）与符号回归（Symbolic Regression）提取兼具表达能力与可解释性的

摘要：人类及其他动物具有获取环境中有关机会信息的驱动力，但其如何评估何种信息值得学习仍不清楚。本研究结合人工神经网络（Artificial Neural Network, ANN）与符号回归（Symbolic Regression）提取兼具表达能力与可解释性的模型，以明确人类被试在抉择过程中如何评估决策相关信息的信息价值（Value of Information, VoI）。所恢复的函数主要取决于跨选项累积的相对证据而非各选项的绝对不确定性，揭示被试追求选项间信息对称性（information symmetry）而非逐选项最小化不确定性。该账户优于标准基于不确定性的探索模型并可推广至独立数据集。利用优化用于中脑和脑干成像的超高场（7 T）功能磁共振成像（functional Magnetic Resonance Imaging, fMRI），研究人员同时测量五个神经调质核团及两个皮层区域的活性。腹侧被盖区（Ventral Tegmental Area, VTA）活动对信息价值与选择价值呈相反编码，适于仲裁采样与选择；前扣带回皮层（Anterior Cingulate Cortex, ACC）和前岛叶（Anterior Insula, AI）追踪信息价值计算过程。

论文解读：人工神经网络的可解释抽象表征预测人类信息采集中行为及神经活动

该文由Rushworth等人（Oxford University）发表于《Nature Neuroscience》。人类及动物在决策前需搜集证据，何时停止采样（sampling）及采集哪个备选选项的信息是决策科学的核心问题。传统认知神经科学采用固定形式的数学模型（如线性不确定性函数或上置信界Upper Confidence Bound, UCB算法）描述信息价值（Value of Information, VoI），但这类模型难以捕捉复杂非线性的人类信息采样策略；而纯数据驱动的人工神经网络（Artificial Neural Network, ANN）虽具强拟合能力却缺乏可解释性。此外，信息采样背后的神经机制——特别是中脑神经调质核团（腹侧被盖区Ventral Tegmental Area, VTA；黑质Substantia Nigra, SN；中缝背核Dorsal Raphe Nucleus, DRN；蓝斑Locus Coeruleus, LC；腹侧嗅核Ventral Septal Nucleus, VSN）与前扣带回皮层（Anterior Cingulate Cortex, ACC）、前岛叶（Anterior Insula, AI）如何编码VoI——尚存争议。本研究旨在提出一种混合建模框架，结合ANN的灵活性与符号回归的可解释性，揭示人类信息采样的计算原则并定位其神经相关物。

主要关键技术方法

研究人员招募20名健康人类被试（14名女性，19–32岁）完成双选项点阵信息采样任务并行7 T fMRI扫描（1 mm各向同性体素，有限视野覆盖中脑、脑干及皮层）。行为数据采用混合效应逻辑回归与留一法交叉验证进行模型比较。计算建模构建混合认知模型：知识驱动模块处理信念更新（含工作记忆衰减与注意力折扣）与选择价值（Value of Selection, VoS）计算，数据驱动模块用ANN、线性函数或UCB算法计算VoI；对训练好的ANN施加符号回归（SymbolicRegression.jl, PySR）提取闭式数学表达式。fMRI数据分析采用一般线性模型（General Linear Model, GLM）以各模型输出的VoI和VoS为参数调制因子，在中脑五个预设感兴趣区（Region of Interest, ROI：VTA, SN, DRN, LC, VSN）及全脑（ACC, AI）进行组水平随机效应分析，并以均方误差（Mean Squared Error, MSE）和混合效应模型比较不同VoI计算的神经拟合优度。符号模型跨任务泛化检验使用独立的两臂赌博机（two-armed bandit）数据集（n=89）。

研究结果

Sampling behavior adaptively scales with task difficulty and uncertainty（采样行为随任务难度与不确定性自适应调整）

通过泊松混合效应回归与动态规划求解马尔可夫决策过程（Markov Decision Process, MDP）最优策略，研究人员发现被试在初始不确定性更高（绿色点更少）或两选项红点差异更小（更难试次）时采集更多样本，且能忽略被阻断第三选项的无关背景不确定性。采样行为定性匹配最优策略但存在个体差异（部分过度采样牺牲总收益），证明人类信息采样具适应性并能区分相关与无关不确定性来源。

The ANN-derived VoI predicts participants' sampling decisions（ANN导出的信息价值预测被试采样决策）

将线性、UCB及含ANN的杂交模型拟合行为数据并交叉验证，杂交ANN模型对所有被试拟合优度均优于线性与UCB模型，且与端到端（end-to-end）无约束ANN预测性能相当。特征选择表明VoI取决于已揭示点数（样本量N_a, N_u）而非主观红点比例ρ，混合逻辑回归显示习得VoI显著驱动"继续采样vs做选择""停留当前patch vs切换patch"及"最终选择"三嵌套决策。

The ANN integrates evidence from both patches to compute VoI（ANN综合两选项证据计算信息价值）

可视化ANN习得VoI函数表面显示：线性与UCB模型VoI只依赖本选项样本数，而ANN的停留价值（value of stay）随关注选项已采样本N_a增而升、随未关注选项N_u增而降，切换价值（value of switch）呈相反二维整合；收集一个新样本后停留价值降、切换价值升（对角向量场），表明ANN学到跨选项相对证据整合——即信息对称性原则。

The ANN can be transformed into an interpretable symbolic function（ANN可转化为可解释符号函数）

对训练后ANN做符号回归得封闭表达式：Value of staying = β₁+ exp(?|β₂|·N_attended/N_unattended)；Value of switching = β₃+ exp(?|β₄|·log(2·N_unattended)/N_attended)。四参数分别解释为注意惯性（attentional inertia, β₁）、信息饱和（information satiation, β₂，N_a/N_u比越大停留价值越低）、非定向探索（undirected exploration, β₃）与定向探索（directed exploration, β₄，N_a相对N_u积累使切换价值升高）。首访与再访分设参数。代入杂交模型后符号模型行为拟合与ANN无显著差异，且在独立两臂赌博机数据集上显著优于UCB（含带偏移UCB），证实其捕获人类探索行为的跨任务通用计算原则——追求选项间信息对称而非基于绝对样本数的UCB式不确定性递减。

The ANN-derived VoI can predict neural activity（ANN导出VoI可预测神经活动）

以四种VoI（线性、UCB、符号、ANN）为GLM参数调制比对全脑及ROI的BOLD拟合MSE，ANN导出VoI显著优于线性（Cohen's d = ?1.025, P = 2.12×10^?12）与UCB（Cohen's d = ?1.105, P = 5.64×10^?13），符号函数与ANN差异可忽略（Cohen's d = ?0.129, P = 0.006），说明符号抽象保留了ANN的神经预测力。

AI and ACC covary with the ANN-derived VoI（前岛叶与前扣带回皮层随ANN导出VoI共变）

全脑分析显示AI与ACC BOLD信号与VoI_stay?VoI_switch之差呈负相关、与VoI_stay+VoI_switch之和呈负相关，即AI与ACC随切换信息价值升高而激活增强、随停留价值升高而减弱，编码信息增益潜力及当前与替代选项相对信息价值，参与"停留/切换"与"采样/选择"仲裁。ROI内模型比较确认杂交ANN与符号模型远优于线性/UCB。

中脑核团ROI分析

VTA对选择价值和（ΣVoS）呈正编码（β=11.3, P=0.020）、对信息价值和（ΣVoI）呈负编码（β=?46.1, P=1.93×10^?5），形成采样与抉择间的仲裁信号。SN模式近似AI/ACC：对ΣVoI（β=?24.9, P=6.38×10^?5）与ΔVoI（β=?22.7, P=0.008）均负关联，编码整体信息增益潜力及跨选项相对信息价值。DRN、LC、VSN内未发现VoI或VoS显著关联（测量灵敏度范围内）。各皮下ROI中ANN-VoI的GLM MSE均显著低于线性VoI，四处（除LC）显著低于UCB-VoI。

讨论（结论部分翻译与总结）

研究发现人类信息采样由四参数符号函数描述，其中信息饱和（β₂）与定向探索（β₄）协同使决策者平衡跨选项知识而非穷尽单选项——即信息对称性原则。杂交ANN加符号回归工作流先以Lipschitz约束ANN学复杂映射再用符号回归提炼可读方程，既保预测精度又获机制洞察，优于直接端到端黑箱ANN或直接符号回归。所发现VoI函数推广至异质两臂赌博机任务。VTA正编码选择价值、负编码信息价值，适于仲裁持续采样与最终抉择；ACC与AI追踪VoI计算，SN具类似模式；LC/DRN/VSN在此任务中未显VoI编码。该方法具认知科学与神经科学广泛适用性。局限性含公式针对双选项结构、未正交操纵决策/证据/奖赏不确定性类型。

热点排行