综述:机器学习驱动的摘要统计量在系统生物学模型参数贝叶斯推断中的机遇与挑战
【字体:
大
中
小
】
时间:2025年10月10日
来源:Current Opinion in Systems Biology 2.2
编辑推荐:
本综述系统探讨了机器学习(ML)为近似贝叶斯计算(ABC)提供自动化摘要统计量的前沿进展。文章剖析了传统专家驱动方法的局限性,指出ML方法在提升参数可辨识性、降低计算成本方面的潜力,同时深入讨论了其面临的信息性、可解释性与计算效率之间的权衡,为系统生物学领域的参数推断提供了重要方法论参考。
在系统生物学研究中,机制模型通过刻画代谢物、蛋白质、基因与细胞间的动态相互作用,以解释和预测复杂生物行为。由于分子过程参数(如酶促速率常数、基因表达率、转运系数等)很少能被直接测量,模型参数化本质上是一个反问题——需从系统层面的观测数据(如时间序列、剂量响应曲线、单细胞读数等)中推断出各组分的具体参数值。
参数推断不仅为理解分子相互作用如何塑造系统行为提供机制性见解,还能通过构建经过良好校准的模型获得预测能力,从而支持对新的实验条件(如药物处理、遗传扰动或合成回路设计)进行可靠的外推。在诸多推断方法中,贝叶斯方法以先验分布为起点,通过结合观测数据更新后验分布。然而,系统生物学模型常包含隐变量、随机反应事件或部分可观测性,导致闭式似然函数通常难以获得,此时必须依赖计算替代方法或免似然方法。
近似贝叶斯计算(ABC)正是一种免似然的贝叶斯推断框架,它通过直接比较模拟数据与观测数据来避开似然计算,特别适用于复杂动态的机制模型。然而,ABC的有效性极度依赖于摘要统计量的选择——这些统计量需在压缩高维原始数据的同时保留对参数敏感的信息、滤除无关噪声,并使得基于模拟的比较在计算上可行。
传统摘要选择通常分两阶段:先由领域专家提出候选特征集合,再通过子集选择或投影方法进行降维。前者利用信息准则(如AIC、BIC)或后验熵挑选信息量大的特征子集,后者则采用线性或非线性映射(如主成分分析PCA、核方法)将高维特征投影至低维空间。
然而,专家驱动的方法存在主观性强、特征设计耗时等缺点。近年来,机器学习提供了自动学习摘要的新途径。早期方法集中于使用带正则化的回归模型(如岭回归、Lasso、弹性网络)构造平滑且稀疏的投影,以提升摘要的稳健性并防止过拟合。
更先进的表示学习方法则能够从原始数据中直接学习摘要表示,例如利用自动编码器(Autoencoder)将高维数据编码为低维潜在变量,或使用卷积神经网络(CNN)处理序列或图像数据、循环神经网络(RNN)处理时间序列。这些方法不仅能自动提取显著特征,还可通过无监督或半监督方式减少对专家知识的依赖。
多个系统生物学案例研究揭示了不同摘要选择方法在准确性、可解释性与计算成本之间的权衡。例如,在群体遗传学研究中,研究者对比了手工选择的六种摘要统计量与基于前馈神经网络的自动摘要方法,发现后者在推断突变和重组速率方面显著提高了后验精度。在信号转导模型中,使用随机森林回归生成的摘要也优于传统专家选择的特征,尤其在数据存在高噪声时表现更为稳健。
这些研究表明,机器学习方法尤其适用于高维、异构且噪声明显的系统生物学数据,能够有效提升参数可辨识性并加速推断过程。
尽管机器学习摘要具有巨大潜力,但其应用也面临诸多挑战。深度神经网络(DNN)虽能学习高度非线性的映射,却容易过拟合于模拟数据中的伪影而非真实的参数-数据关系。这种过拟合会导致ABC中的距离比较失去意义,进而产生有偏的后验分布。
此外,机器学习摘要常被批评为“黑箱”,缺乏可解释性,难以与已知生物学特征关联。因此,如何在保持高信息量的同时提升摘要的可理解性,成为当前研究的关键问题。
为提高机器学习摘要的可解释性,研究者开发了一系列事后解释工具。例如,可通过主成分分析投影学习到的摘要,并将各成分与手工选择的统计量(如爆发大小、信使RNA水平等)进行相关性分析,以识别其生物学含义。还可借助注意力机制(Attention Mechanism)或显著性图(Saliency Maps)突出输入数据中对摘要生成最敏感的区域,从而增强模型决策的透明度。
引入可解释性不仅有助于验证摘要的合理性,还能帮助研究者发现数据中前所未见的模式,进一步推动对生物系统的机制性理解。
本研究由加拿大自然科学与工程研究理事会(NSERC)发现基金(RGPIN-2018-03826)资助。Sebastian H?pfl 获德国研究基金会(DFG)FOR 5151 QuaLiPerF 研究单位计划(编号436883643)支持。此项工作完成于Haldimand Tract——1784年授予豪德诺索尼(六部落)的土地,该声明亦承认殖民历史对原住民土地权利的侵害。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号