综述:基于 Shapley 值评估生物网络分析中节点重要性的全面综述

【字体: 时间:2025年05月07日 来源:Computer Methods and Programs in Biomedicine Update CS5.9

编辑推荐:

  这篇综述聚焦于 Shapley 值在生物网络分析中的应用。介绍了 Shapley 值的理论基础,梳理了相关研究方法,如多扰动 Shapley 值分析(MSA)、微阵列博弈等。探讨其在基因调控、代谢等网络研究中的成果,为理解生物系统复杂性提供了有力工具。

  

1. 引言


机器学习(ML)和人工智能(AI)发展迅速,但模型复杂度增加带来可解释性难题,催生了解释性人工智能(XAI)领域。2017 年,Lundberg 和 Lee 提出 SHAP 框架,将 Shapley 值应用于解释模型预测,该框架在多领域取得成功。Shapley 值源于合作博弈理论,可公平分配系统收益,在生物网络分析中也具有重要价值,能量化单个组件的重要性。然而,目前缺乏对其在生物网络分析中应用的全面综述,本文旨在填补这一空白,聚焦创新应用,探讨不同方法的优劣。

2. 文献检索策略和纳入标准


通过检索 “Shapley value”“biological networks” 等关键词,在 PubMed 和 Google Scholar 上共获得 357 项研究,其中 20 项专门聚焦于 Shapley 值在生物网络中的应用。经筛选,确定 6 种具有创新性的方法进行重点综述,排除了应用较为常规的研究。

3. 背景


3.1 Shapley 值


现代博弈论由 John von Neumann 和 Oskar Morgenstern 于 1944 年提出,合作博弈中玩家通过联盟协作。Shapley 值由 Lloyd Shapley 提出,满足对称性、载体性和可加性三个公理,为合作博弈中收益分配提供了公平方案。其计算方法为:对于有N个玩家和收益函数v的博弈,玩家i的 Shapley 值?i(v)?i(v)=N!1S?N?{i}S!(N?S?1)![v(S{i})?v(S)]

以议会博弈为例,在议会投票场景中,不同政党联盟影响法案通过,Shapley 值可衡量各政党在联盟中的贡献。此外,还有一类特殊的博弈 —— 一致同意博弈,其 Shapley 值计算更为高效。在一致同意博弈中,所有玩家对收益分配达成一致,通过将复杂博弈分解为一致同意博弈的线性组合,可简化 Shapley 值计算。

3.2 生物网络背景


生物系统由多种生物实体构成,其结构和功能受 DNA 调控。为研究生物实体间的相互作用,常使用网络模型,如基因调控网络(GRNs)、基因共表达网络、代谢网络、信号网络和蛋白质 - 蛋白质相互作用网络(PPIs)等。

  • 基因调控网络(GRNs):模拟生物功能的调控过程,节点代表基因或转录因子,边表示调控关系。多种建模方法和数据库可用于研究 GRNs,帮助理解疾病机制。
  • 基因共表达网络:展示基因间的相关性,节点为基因,边表示共表达模式,有助于推断基因功能和识别功能模块。
  • 代谢网络:描述代谢途径,节点为代谢物或酶,边表示反应或调控关系,可通过约束性框架如通量平衡分析(FBA)进行研究。
  • 信号网络:由信号通路组成,节点为受体和细胞机制,边表示信息流动,常使用动态模型进行分析。
  • 蛋白质 - 蛋白质相互作用网络(PPIs):呈现蛋白质间的物理相互作用,节点为蛋白质,边表示相互作用关系,可用于预测蛋白质功能。

4. 文献综述


4.1 多扰动 Shapley 值分析 - MSA


2004 年,Keinan 等人提出 MSA,通过多扰动实验评估网络元素对系统性能的贡献,将其视为合作博弈中的玩家,以系统性能为收益计算 Shapley 值。该方法的局限性在于需进行2n次扰动实验(n为元素数量),实际操作困难。为此,研究者提出预测和估计 Shapley 值的方法,并引入二维 MSA 来研究两个元素协同作用的重要性。

MSA 在酵母 Rad6 DNA 修复途径研究中得到应用,还衍生出 k - 有界 MSA 以适应大规模网络分析。此外,MSA 还被用于特征选择算法,如贡献选择算法(CSA)和基于联盟博弈论的特征选择(CGFS)算法,在脑研究等领域也展现出良好效果,能定量分析复杂脑相关数据。

4.2 微阵列博弈和 Shapley 值作为相关性指数


2007 年,Moretti 等人引入微阵列博弈,基于微阵列数据开发基因相关性指数。通过比较正常和肿瘤样本的基因表达矩阵,利用判别方法生成布尔表达谱,构建合作博弈模型,以评估基因对疾病的贡献。该方法将博弈分解为一致同意博弈,降低了计算复杂度。

微阵列博弈在神经母细胞瘤、自闭症谱系障碍(ASD)等疾病基因分析中得到应用,还可用于加速基因集计算和减少基因集合大小。此外,比较 Shapley 值的引导程序(CASh)进一步验证了其在基因分析中的有效性。2020 年,P. Neog Bora 等人受微阵列博弈启发,提出微阵列网络博弈,构建共表达网络并引入链接相关性指数。

4.3 基因的中心性和影响力


2010 年,有研究定义了关键基因和普通基因,通过构建关联博弈和图限制博弈,计算基因在不同博弈中的 Shapley 值,以衡量基因的中心性和影响力。关联博弈的收益函数反映与关键基因相互作用的基因数量,图限制博弈则考虑基因网络结构。通过分解这两种博弈为一致同意博弈,可简化 Shapley 值计算,从而得到基因的中心性度量。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号