基于多目标进化算法的基因调控网络生物驱动共识推断方法BIO-INSIGHT及其临床应用

【字体: 时间:2025年07月01日 来源:Computers in Biology and Medicine 7.0

编辑推荐:

  推荐:本研究针对基因调控网络(GRN)推断中传统方法结果差异大、偏好特定数据集的问题,开发了并行异步多目标进化算法BIO-INSIGHT。该算法通过整合26种推断技术和6个生物学目标函数,在106个GRN基准测试中显著提升AUROC和AUPR指标,并在纤维肌痛和脑脊髓炎患者数据中识别出疾病特异性调控互作,为复杂疾病的生物标志物发现提供了创新工具。

  

基因调控网络(GRN)的推断是系统生物学领域的核心挑战,但现有方法存在两大痛点:不同技术推断结果差异显著,且普遍缺乏生物学背景整合。传统方法如ARACNE、GENIE3等虽各具优势,但在实际应用中常出现同一数据集产生拓扑结构迥异的网络,甚至高准确率的方法之间也存在明显分歧。更关键的是,多数算法仅依赖数学标准优化,导致推断网络可能包含虚假连接或缺失真实调控关系,严重影响后续生物学解释和临床应用价值。

针对这一难题,来自中国的研究团队开发了革命性的BIO-INSIGHT算法。这项发表在《Computers in Biology and Medicine》的研究,创新性地将并行异步进化计算与多目标优化相结合,通过整合26种GRN推断技术(包括信息论基础的CLR、机器学习驱动的GENIE3_RF等),并引入6个生物学指导的目标函数:交互质量(O1)、生物模体(O2)、特征向量中心性分布(O3)、非必需互作削减(O4)、节点度分布(O5)和动态稳定性(O6)。研究团队采用Dormand-Prince 5(4)积分器模拟网络动力学,运用JGrapht库进行拓扑分析,并在106个基准网络(含DREAM3/4挑战赛数据、BioGRID等真实数据库)和43例临床样本(含纤维肌痛、慢性疲劳综合征患者)数据集上验证性能。

研究结果显示,在算法设计方面,BIO-INSIGHT的异步并行架构成功平衡了新增三维目标空间带来的计算负担,其独创的缓存系统减少30%冗余计算。在DREAM4的10节点网络上,各目标函数间呈现显著冲突特征——例如动态稳定性(O6)与特征向量分布(O3)呈负相关,证实多目标优化的必要性。与MO-GENECI相比,BIO-INSIGHT在AUPR指标上平均提升21.7%(Friedman检验p<0.001),且所有对比方法中排名第一。

临床应用中,研究团队分析了43例女性样本(8例ME/CFS、10例纤维肌痛、16例共病患者及9例对照)的1559个基因表达数据。关键发现包括:在ME/CFS组鉴定出32个新增和35个缺失的基因互作,其中CD74-EIF4G2互作(实验验证的亲和捕获-MS互作)特异性存在于ME/CFS组;通路富集显示所有疾病组均存在细胞质翻译、免疫应答等通路的调控异常。特别值得注意的是,CD74作为潜在生物标志物,其与人类内源性逆转录病毒MLT1_5q32的共表达模式为ME/CFS的发病机制提供了新线索。

这项研究的重要意义在于:首次将网络动态稳定性、基因影响力层级等深层生物学特征纳入GRN推断框架,突破了传统数学驱动共识方法的局限性。其临床价值体现在:为缺乏生物标志物的复杂疾病(如ME/CFS)提供了差异调控网络分析工具,鉴定的CD74等关键基因与既往研究相互印证。未来工作将整合深度学习技术,并探索基于网络模块化的分层优化策略,进一步提升大规模GRN推断的效率。研究开源的Python库(PyPI包GENECI/3.0.1)为领域内研究者提供了可直接应用于临床数据的标准化工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号