基于相似性的改进 Louvain 算法(SIMBA):挖掘生物网络活性模块的有力工具

【字体: 时间:2025年04月03日 来源:Scientific Reports 3.8

编辑推荐:

  在生物网络研究中,传统社区检测算法难以识别功能连贯的子网。研究人员开展了 “基于相似性的改进 Louvain 算法(SIMBA)用于活性模块识别” 的研究。结果显示,SIMBA 性能优于现有方法,为揭示生物过程提供了新工具。

  在生命科学的探索旅程中,生物网络的研究至关重要。生物网络,像蛋白质 - 蛋白质相互作用网络和基因调控网络,蕴含着生命活动的奥秘。然而,目前在研究这些网络时遇到了不少难题。传统的社区检测算法,大多只关注网络的拓扑信息,却忽视了节点属性的相似性。这就好比在一幅复杂的地图上,只看各个地点的位置关系,却忽略了每个地点的独特特征,这样很难准确找到那些功能连贯的子网,也就是活性模块(Active Module Identification,AMI) 。比如说,在研究疾病发展或细胞分裂等生物过程时,传统方法仅依赖单个基因的分数,无法发现基因之间的协同作用,那些单个分数不高但组合起来却对生物过程有重要作用的基因群就容易被遗漏。所以,为了更深入地了解生物网络,揭示其中的奥秘,开展新的研究迫在眉睫。
来自法国蔚蓝海岸大学(Université C?te d’Azur)的研究人员 Nina Singlan、Fadi Abou Choucha 和 Claude Pasquier 针对上述问题展开了研究。他们提出了一种新的基于节点属性相似性的图分区评分方法,并改进了 Louvain 算法,将其命名为相似性基于适应性的 Louvain 算法(SIMBA)。这一研究成果发表在《Scientific Reports》上,为生物网络研究带来了新的曙光。

研究人员在开展研究时,运用了多种关键技术方法。首先,定义了新的相似性函数,通过这个函数来衡量节点之间的相似程度,综合考虑了节点间的边以及节点所包含的 p 值信息。同时,还定义了一系列相关的评分函数,如社区评分、图分区评分等,用于评估和比较不同的社区。此外,在算法实现上,对 Louvain 算法进行了改进,使其能够基于拓扑和属性标准识别社区 。

下面来看具体的研究结果:

  1. 模拟数据集实验:在完全生成数据集实验中,研究人员测试了 SIMBA 算法在不同规模和复杂程度的模拟图上的性能,并用归一化互信息(NMI)分数和二进制 F1 分数(bF1)进行评估。结果显示,SIMBA 在模拟的 1000 节点图上,尤其是在包含 10 个不同模块的复杂数据集上,NMI 得分优于其他先进方法。在最简单的数据集上,SIMBA 也比传统的生物学家使用的基线方法表现更好。在重连数据集实验中,研究人员从真实的蛋白质 - 蛋白质相互作用(PPI)网络生成更现实拓扑结构的图进行实验。结果表明,对于更接近真实生物网络结构的重连结构,SIMBA 能更好地提取社区结构,且在执行时间上也适合实际实验室使用。在模拟值数据集实验中,研究人员使用真实拓扑图和模拟的现实值进行实验。结果显示,SIMBA 在执行时间上适合实际实验室应用,且在 NMI 和 F1 分数上优于其他方法 。
  2. 真实图实验:研究人员将 SIMBA 应用于一个研究 Cmpd60(一种选择性 HDAC1/2 抑制剂)对老年小鼠心脏、肾脏和大脑的老年保护作用的 RNA 测序(RNA-seq)数据集。在肾脏中,模块分析揭示了与抗纤维化和延长寿命相关的过程;在大脑中,发现了与减轻痴呆相关过程一致的网络;在心脏中,识别出与改善心脏功能相关的网络。这些结果表明,SIMBA 能够识别出功能相关基因的潜在网络和通路,为理解生物过程提供了新的视角。

研究结论和讨论部分指出,SIMBA 为节点属性图中的社区检测提供了一种新方法,特别适用于生物信息学中的 AMI。与传统社区检测技术相比,SIMBA 考虑了拓扑和属性信息,能够发现仅基于拓扑信息可能无法发现的社区。而且,SIMBA 不需要预先指定社区的数量,也不需要确定模块相关性的阈值,在各种数据集上都表现出了优越的性能。其效率和可扩展性,使其成为研究复杂生物过程的有力工具。未来的研究可以进一步探索更复杂的评分函数,结合特定领域的知识和先进的机器学习技术,以提高对网络中复杂模式和关系的识别能力,这有望开发出更强大、更通用的社区检测算法,推动生命科学和健康医学领域的发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号