
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:系统生物学中不确定性的量化与管理:机制模型与数据驱动模型
《Current Opinion in Systems Biology》:Quantifying and Managing Uncertainty in Systems Biology: Mechanistic and Data-Driven Models
【字体: 大 中 小 】 时间:2025年09月07日 来源:Current Opinion in Systems Biology 2.2
编辑推荐:
这篇综述深入探讨了系统生物学建模中(不确定性量化UQ)的核心挑战,聚焦(机制模型)与(数据驱动模型)的(可减少认知不确定性epistemic uncertainty)管理策略,涵盖(参数识别)、(最优实验设计OED)及(混合建模)等前沿方法,为提升模型可靠性提供系统性解决方案。
不确定性是系统生物学模型面临的核心挑战,尤其源于数据局限性和知识缺口形成的可减少认知不确定性(epistemic uncertainty)。本文系统梳理了机制模型(如动态动力学模型、基因组尺度代谢模型GEM)与数据驱动模型(如时序数据训练的神经网络)中的不确定性来源,并提出通过轮廓似然度、贝叶斯推断、集成建模和主动学习等策略进行量化与缓解。案例研究揭示了数据质量、模型结构和实验设计对预测可靠性的关键影响,并展望了结合机制模型与机器学习(ML)的混合框架等未来方向。
系统生物学模型分为提供因果解释的机制模型和挖掘数据模式的机器学习模型,二者均受数据误差和知识缺口的影响。不确定性分为固有随机性导致的不可减少偶然不确定性(aleatoric uncertainty)和可通过优化实验设计减少的认知不确定性。本文重点关注后者在动态系统建模中的表现与管理。
数据不确定性:包括随机/系统测量误差和缺失数据,前者增加参数估计方差,后者导致模型偏差。知识缺口:表现为模型结构简化或错误假设,例如忽略关键生物相互作用。图1展示了不确定性从数据到模型预测的传递路径。
3.1 基因组尺度模型(GEM)
GEM通过通量平衡分析(FBA)预测代谢网络行为,但面临反应网络不完整、目标函数选择等不确定性。通量变异性分析(FVA)和帕累托最优FBA(pFBA)可缩小解空间,而贝叶斯方法(如BayFlux)能整合多组学数据量化通量不确定性。
3.2 动态机制模型
参数不确定性:通过结构/实际可识别性分析评估,其中轮廓似然度和Fisher信息矩阵(FIM)是常用工具。最优实验设计(OED)可针对性减少高敏感参数的不确定性(图3)。结构不确定性:模型简化可能导致观测等效性,需通过多模型推断或KL散度驱动的OED解决(图4)。
3.3 数据驱动模型
神经网络(如GRU、神经ODE)对参数扰动敏感(图5)。贝叶斯神经网络(BNN)和蒙特卡洛Dropout(MC Dropout)能量化权重不确定性,而主动学习可优化数据采集效率。
提出六步迭代流程:模型结构评估→敏感性分析→模型选择→不确定性量化→实验优化→验证反馈。表1-2根据模型复杂度推荐UQ方法,如小规模模型适用FIM,大数据集适用深度集成。
混合建模:如物理信息神经网络(PINN)和通用微分方程(UDE),结合机制约束与数据拟合能力。工具标准化:需开发集成SBML的UQ平台。社区基准:建立涵盖参数非识别性、结构不确定性的测试案例库,推动方法可比性。
全文强调:通过方法创新与跨学科协作,系统生物学模型将更可靠地服务于合成生态、精准医学等前沿领域。
生物通微信公众号