一种基于贝叶斯逆向监督学习的框架,用于研究石墨烯场效应晶体管中酶的活性

《Machine Learning with Applications》:A Bayesian inversion supervised learning framework for the enzyme activity in graphene field-effect transistors

【字体: 时间:2025年08月09日 来源:Machine Learning with Applications 4.9

编辑推荐:

  酶动力学参数计算与GFET传感技术结合的机器学习框架研究。

  随着科技的不断发展,酶的检测和分析在生物医学、环境监测以及工业催化等领域发挥着越来越重要的作用。在这些应用中,高度敏感的检测手段和准确的参数估计方法是关键。其中,石墨烯场效应晶体管(GFETs)因其卓越的电子性能和高表面灵敏度,正逐渐成为研究酶反应和评估酶动力学参数的重要工具。本研究的目标是开发一种基于计算的框架,通过GFETs的电气响应数据,对酶的反应速率和动力学参数进行精确估算。同时,我们还构建了一种新型的深度神经网络模型,利用贝叶斯逆推方法对酶的行为进行预测,进一步提升模型的准确性和适用性。

GFETs能够有效监测和检测酶反应的电气特性变化,这得益于其对环境变化的高度敏感性。酶的催化过程会改变其周围的电场,从而影响GFET的通道电导率。这种变化可以通过电流或电压的波动来体现,为酶活性的实时监测提供了可能性。此外,GFETs相较于传统方法,具有更高的灵敏度、实时和连续监测能力、无标记检测原理、高可变性和成本效益等优点,使其在酶学研究中展现出广阔的应用前景。

然而,传统的实验方法在酶动力学参数的测定中存在诸多挑战,包括需要复杂的实验设计、精确的测量技术和严谨的数据分析。特别是对于实验中多种化学和环境因素的组合,如不同的底物浓度、pH值和温度,实验数据的获取往往受限于时间和资源。为了解决这一问题,我们提出了一个结合机器学习和贝叶斯逆推的计算框架,旨在通过实验数据预测酶的反应速率和动力学参数。该框架利用机器学习模型对广泛范围内的底物浓度、pH值和温度进行预测,随后通过贝叶斯逆推方法,基于这些预测结果,对相应的动力学参数进行估计。这种方法不仅提高了参数估计的准确性,还显著减少了对实验数据的依赖。

在本研究中,我们选择过氧化物酶(如辣根过氧化物酶,HRP)和血红素分子作为研究对象,这两种物质在生物化学和生物技术中具有广泛的应用价值。通过将它们固定在石墨烯表面,我们能够在不同条件下评估其催化反应,并生成用于机器学习模型训练的数据集。在实验过程中,我们测量了GFET的源漏电流(Ids),并利用这些数据计算酶的反应速率。同时,我们考虑了多种实验条件,包括pH值、温度、底物类型和浓度,以确保模型的全面性和适用性。

为了提高模型的准确性,我们采用了贝叶斯逆推方法,特别是马尔可夫链蒙特卡洛(MCMC)方法,包括随机游走马尔可夫链蒙特卡洛(RWM)、延迟拒绝自适应马尔可夫链蒙特卡洛(DRAM)以及集合卡尔曼滤波MCMC(EnKF-MCMC)。这些方法在处理复杂和高维模型参数估计时具有显著的优势,能够有效处理数据中的不确定性和模型误差。通过比较这些方法的性能,我们发现EnKF-MCMC在参数估计和模型收敛性方面表现最佳,而TQSSA(总准稳态近似)在计算酶动力学参数时比QSSA(准稳态近似)更准确,尤其在底物浓度较高的情况下,其预测结果更为稳定。

此外,我们还引入了一种基于深度神经网络(DNN)的贝叶斯逆推框架,即多层感知器深度神经网络贝叶斯逆推(MLP-DNN-BI)。该模型通过学习实验数据与动力学参数之间的关系,实现了对酶反应的预测。在模型训练过程中,我们采用了鲁棒缩放(Robust Scaling)技术对输入特征进行标准化处理,以减少极端值对模型训练的影响。同时,我们还通过数据打乱(Shuffle)技术,提高模型的泛化能力,避免过拟合现象。模型的输出包括KM和kcat,这两个参数分别代表酶的米氏常数和催化效率,是评估酶性能的重要指标。

为了验证模型的性能,我们进行了数值模拟和实验分析。实验数据涵盖了多种底物浓度(1-1000 μM)、pH值(4-7)和温度(22-28 °C)的条件,同时考虑了两种底物类型(ABTS和H2O2)。通过对比不同方法的性能,我们发现TQSSA结合EnKF-MCMC的组合方法在参数估计和模型预测方面表现最优,能够有效减少预测误差,提高模型的准确性。此外,我们的模型在不同pH值和温度条件下均表现出良好的稳定性,说明其具有较强的泛化能力。

在模型的训练和测试过程中,我们采用了80%的数据用于训练,20%的数据用于验证。这一比例确保了模型在训练时能够充分学习数据特征,同时在验证阶段能够准确评估其性能。通过监测模型在训练和验证阶段的损失函数(如均方根误差RMSE),我们发现模型的性能随着训练次数的增加而逐步提升,最终达到较高的预测精度。此外,我们还通过回归分析,验证了模型预测结果与实际实验数据之间的关系,结果显示大多数数据点与对角线接近,表明模型具有良好的预测能力。

为了进一步增强模型的可解释性,我们还对模型中的各个实验因素进行了权重分析。通过动态调整各因素的权重,模型能够更准确地反映实验条件对酶反应的影响。例如,在较高底物浓度的情况下,温度的权重显著增加,表明其对反应速率的影响更为明显;而在较低底物浓度时,pH值的权重则相对较低,说明pH值的影响较为有限。这种动态权重调整不仅提高了模型的预测精度,还为研究人员提供了更直观的理解,帮助他们在实际应用中更好地设计和控制实验条件。

尽管本研究的模型在参数估计和酶反应预测方面表现出色,但仍存在一些局限性。首先,由于实验数据的获取受限于时间和资源,我们无法覆盖所有可能的实验条件,这可能影响模型的泛化能力。其次,模型的计算复杂度较高,当处理大规模或实时数据时,可能面临计算效率和资源消耗的问题。因此,未来的研究可以进一步优化模型的计算效率,探索适用于大规模数据集的其他模型架构,如基于Transformer的序列模型。此外,还可以考虑引入物理信息神经网络(PINNs),将已知的酶动力学约束直接嵌入到神经网络的损失函数中,以提高模型在数据有限情况下的泛化能力。

总的来说,本研究提出的计算框架和深度神经网络模型为酶动力学参数的估算和酶反应的预测提供了新的方法和工具。通过结合GFETs的高灵敏度检测能力和贝叶斯逆推的参数估计优势,我们开发出一种高效、准确且具有较强可解释性的模型,能够适应多种实验条件和环境变化。未来的工作可以进一步扩展数据集,探索更复杂的模型架构,并验证模型在实际应用中的有效性。这不仅有助于推动酶学研究的发展,也为生物医学、环境监测和工业催化等领域提供了新的技术手段。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号