
-
生物通官微
陪你抓住生命科技
跳动的脉搏
伪数据集用于估计人工神经网络中的特征归因
《Scientific Reports》:Pseudo datasets estimate feature attribution in artificial neural networks
【字体: 大 中 小 】 时间:2025年11月24日 来源:Scientific Reports 3.9
编辑推荐:
神经网络预测能力虽强但缺乏可解释性,现有方法多聚焦单特征忽略交互效应。本文提出两阶段Pseudo Datasets Perturbation Effect(PDPE)方法,通过数据扰动评估特征及其交互作用重要性,计算机模拟显示其较SHAP更准确高效,真实临床数据验证其有效性。
神经网络在各种分类任务中表现出卓越的预测性能。然而,由于其缺乏可解释性,这些模型的广泛应用受到了限制。因此,近年来许多研究人员专注于模型解释技术,以阐明这些“黑箱”模型的内部机制。然而,现有的解释方法主要集中在解析单个特征上,从而忽略了多个特征之间的协同效应和相互作用,这可能阻碍了对模型预测行为的全面理解。为此,本研究提出了一种两阶段解释方法,称为伪数据集扰动效应(PDPE)。该方法的基本思想是通过扰动数据并观察其对预测结果的影响来辨别特征的重要性。在结构化数据的情况下,PDPE可以在评估单个特征及其交互项的相对重要性时识别潜在的特征交互作用。与广泛认可的SHAP值方法相比,我们在模拟神经网络(这些网络近似于逻辑回归的线性关联)中的计算机实验表明,PDPE能够提供更快、更准确的解释。PDPE有助于用户理解单个特征及其交互作用对模型预测的重要性。此外,使用来自美国国家糖尿病、消化系统疾病和肾脏疾病研究所的真实数据,分析结果也显示了这种新方法的优越性能。
生物通微信公众号
知名企业招聘