
-
生物通官微
陪你抓住生命科技
跳动的脉搏
LM-Merger:基于逻辑模型融合的基因调控网络整合方法及其在急性髓系白血病研究中的应用
【字体: 大 中 小 】 时间:2025年07月17日 来源:BMC Bioinformatics 2.9
编辑推荐:
本研究针对基因调控网络(GRN)模型覆盖范围有限的问题,开发了LM-Merger工作流,通过半自动化方式整合逻辑模型,显著提升了急性髓系白血病(AML)模型的预测能力。研究人员采用SBML-qual标准化格式,创新性地提出OR/AND/Inhibitor Wins三种规则整合策略,成功将两对AML相关模型的基因覆盖率提高30%以上,临床预测准确率提升15%。该成果为构建更全面的疾病机制模型提供了新范式。
在精准医疗时代,基因调控网络(GRN)模型已成为解析疾病机制的重要工具。急性髓系白血病(AML)作为最具侵袭性的血液恶性肿瘤,其复杂的基因突变谱使得单一GRN模型往往只能反映部分病理机制。现有模型存在三大痛点:覆盖基因有限(平均仅包含30-50个关键基因)、规则系统不兼容(不同团队使用差异化的逻辑表达)、临床转化困难(难以整合多组学数据)。这导致模型预测范围狭窄,对NRAS等常见突变基因的覆盖率不足15%,严重制约了个体化治疗决策。
美国系统生物学研究所(Institute for Systems Biology)和华盛顿大学的研究团队在《BMC Bioinformatics》发表创新性解决方案。研究团队开发的LM-Merger工作流包含五大核心技术:1)基于HGNC标准的基因标识统一化;2)SBML-qual格式转换器;3)CoLoMoTo环境下的模型验证模块;4)三种确定性规则整合算法(OR/AND/Inhibitor Wins);5)多维度评估体系。研究采用TCGA、Beat AML等公开数据集,包含1,542例AML样本的突变和表达谱。
【模型构建方法】
研究团队首先建立标准化流程:通过Cell Collective等数据库获取原始模型,使用HGNC REST API统一基因命名,转换为SBML-qual格式。关键创新在于规则整合策略:对于重叠节点,提供OR(取并集)、AND(取交集)、Inhibitor Wins(抑制优先)三种布尔逻辑组合方式。以TP53基因为例,原Palma模型仅包含ARF激活路径,整合Ikonomi模型的MDM2负反馈后,形成更完整的调控网络。
【造血发育模型整合】
首组实验整合了Bonzanni(2011)和Krumsiek(2013)的造血分化模型。两模型仅共享6个基因(如Gata1、Runx1),但分别包含独特的AML相关基因。整合后模型节点数增加47%,成功重现原始模型的9个稳态(如M2.1对应原始模型的B2.1和K5.1红细胞状态)。单细胞RNA-seq验证显示,扩展模型对CEBPA等新增基因的预测准确率(r=0.84)显著优于原模型(r=0.72)。
【AML疾病模型整合】
第二组整合Palma(2021)和Ikonomi(2020)的AML模型。整合模型节点数增加58%,产生40个稳态(原模型共12个)。关键突破在于:1)覆盖NRAS等原模型缺失的突变基因(临床覆盖率从72%提升至89%);2) blast细胞比例预测相关系数从0.68提升至0.81;3) TP53突变患者的预测误差降低32%。Beat AML队列验证显示,整合模型对复杂突变组合的预测优势更显著。
【创新价值与展望】
该研究突破性地解决了GRN模型"碎片化"难题:1)方法论上,首次系统化解决逻辑模型兼容问题;2)临床上,使AML模型覆盖突变谱扩大1.8倍;3)技术上,为生物医学数字孪生奠定基础。局限性在于当前仅支持布尔模型,未来将扩展多值逻辑支持。研究者已开源工作流(GitHub/llyaLab),并与CALM倡议合作推动模型标准化。
这项研究标志着计算系统生物学的重要进步——通过智能整合既有知识,构建更接近真实生物系统的预测模型。正如研究者强调:"模型融合不是简单叠加,而是创造新的涌现特性"。该方法已应用于乳腺癌、胰腺癌等疾病模型整合,为复杂疾病的机制解析提供了普适性框架。随着单细胞多组学数据的爆发式增长,LM-Merger有望成为连接离散生物学发现与整体系统认知的关键纽带。
生物通微信公众号
知名企业招聘