基于物理信息深度学习的等离子体传感技术实现溶液中纳米级蛋白质动态的实时定量分析

【字体: 时间:2025年09月27日 来源:SCIENCE ADVANCES 12.5

编辑推荐:

  本研究针对水溶液中纳米级蛋白质二级结构定量分析的难题,开发了一种结合石墨烯-金超表面传感器与合成复频波(s-CFW)增强卷积神经网络(CNN)的新方法。该技术通过混合石墨烯等离子体(h-GP)将热点区域压缩至13 nm2,显著降低水分子干扰,成功实现对丝素纳米纤维(SNF)组装过程中β折叠、无规卷曲和转角结构的实时监测,预测误差小于0.1,精度比传统CNN提高两倍以上,为生理环境下蛋白质动态研究提供了突破性解决方案。

  
在生命科学领域,精确解析水溶液中纳米级蛋白质的二级结构动态变化一直是项重大挑战。蛋白质的构象转变与其功能发挥密切相关,例如β折叠片的异常聚集与阿尔茨海默症、帕金森病等神经退行性疾病的发生直接相关,而丝素蛋白中β折叠与无规卷曲的比例决定了蚕丝纤维的力学性能。虽然AlphaFold和RoseTTAFold等深度学习模型在蛋白质结构预测方面取得突破,但它们对水环境中动态过程的预测能力仍受限于训练数据不足。
传统傅里叶变换红外(FTIR)光谱技术在水溶液环境中面临巨大障碍——水分子的强吸收会严重干扰蛋白质酰胺I带(1600-1700 cm-1)的信号,而这个特征峰正是识别β折叠、α螺旋和无规卷曲等二级结构的关键。虽然表面增强红外吸收(SEIRA)技术通过等离子体效应能放大蛋白质信号,但常规等离子体热点尺寸通常大于蛋白质分子,难以完全排除水分子干扰,导致定量分析精度有限。
针对这一技术瓶颈,研究人员在《SCIENCE ADVANCES》上发表了一项创新性研究,他们巧妙地将等离子体传感技术与人工智能相结合,开发出一种能够实时、原位监测水溶液中纳米级蛋白质动态变化的新方法。
该研究主要运用了四项关键技术:基于石墨烯-金(Gr/Au)超表面的红外等离子体传感器制备技术,通过电化学方法制备约2 nm面内纳米间隙;合成复频波(s-CFW)增强算法,通过傅里叶变换和线性响应叠加原理间接合成复频光谱;物理信息卷积神经网络(CNN)模型,采用迁移学习策略先使用模拟数据集预训练再使用实验数据微调;有限元模拟方法,使用COMSOL Multiphysics 6.0软件计算等离子体分散关系和电场分布。
红外等离子体传感器用于水环境中蛋白质二级结构的定量分析
研究人员设计了一种基于Gr/Au超表面的红外等离子体传感器。该传感器采用被石墨烯薄膜环绕但不直接接触的金纳米天线结构,面内间隙约2 nm,能够激发可调谐且超限域的混合石墨烯等离子体(h-GP)。当蛋白质通过疏水作用和π-π堆叠吸附到石墨烯上时,能够有效置换热点区域的水分子。通过电调石墨烯的费米能级(EF),研究人员可以测量传感器的消光光谱(消光=1-T/T0),从而探测h-GP热点内的纳米级蛋白质,消除水吸收的影响。
以丝素纳米纤维(SNF)为例,研究发现h-GP与组装的SNF的消光光谱在约1550 cm-1处出现了一个未识别的凹陷,可归属于酰胺II带。此外,在1628 cm-1(黄色箭头)和1650 cm-1(红色箭头)附近也出现了一些未识别的特征峰,分别表明SNF的β折叠和无规卷曲结构。然而,由于h-GP热点中仍存在一些残留水,其OH弯曲模式与SNF的红外光谱中的酰胺I带重叠,阻碍了SNF二级结构百分比(SD%)的精确量化。
水溶液中高度限域且可调的Gr/Au超表面
通过参数与实验匹配的有限元模拟,研究人员研究了Gr/Au超表面的光学特性并计算了其色散曲线。在1650 cm-1处,h-GP的波长压缩(λ0p,其中q为h-GP的波矢量,k0为自由空间波矢量)达到约135,超过了GP(约93)和声学石墨烯等离子体(AGP)(约114)。h-GP的最大电场增强(|E/E0|,E和E0分别为有/无石墨烯和金时的电磁场强度)沿x方向在x=2 nm处达到约176,沿z方向在石墨烯附近达到约40。h-GP将90%的热点强度限制在面内纳米间隙内(即2.0 nm),沿z方向将90%的热点强度限制在约6.5 nm内,因此h-GP的有效热点面积为13 nm2,比GP小一个数量级以上。
石墨烯和金天线之间的面内间隙使得能够在水溶液中对h-GP响应进行原位和动态调节,实现蛋白质的选择性识别。研究人员将SF溶液(30 μg/ml,298 K)注入传感器,增加ΔVG(即|VG-VCNP|)引起h-GP共振峰蓝移。蛋白质酰胺带与h-GP共振的对齐增强了它们的耦合强度,产生两个凹陷。为了区分1600-1700 cm-1区域内SNF的νAmide I和H2O的νOH的贡献,研究人员注入99.9% D2O以完全替代传感器内的H2O。通过对这些光谱进行二阶导数处理,他们观察到h-GP与SNF(H2O)在1628、1650和1675 cm-1附近(图2E中的灰色箭头所示)与SNF(D2O)具有相似的特征。这些结果表明检测到了二级结构特征(即β折叠、无规卷曲和转角),原因是h-GP热点中的水分子极少。
基于迁移学习的CNN模型用于定量二级结构
传感器能有效识别水溶液中SNF组装过程中的二级结构特征。然而,由于残留水信号,从这些SEIRA光谱中量化SD%仍然是一个显著挑战,因为h-GP热点仍然大于吸附的组装中间体尺寸[即约0.8至2.2 nm厚度,在成核阶段;(7)]。传统的数学处理结合异位背景扣除方法解析SEIRA光谱中的SD%既耗时又容易出错。
为了扩大有限的SEIRA光谱数据集,研究人员从基于迁移学习的CNN模型开始。核心思想是使用反映物理定律的模拟训练数据集,并通过迁移学习将学到的经验和物理知识转移到目标任务(即微调),从而减少数据需求并提高训练效率。如图3A所示,CNN模型最初使用蛋白质的模拟SEIRA光谱进行预训练,以体现底层物理规律。该数据集包含31种具有不同β折叠、无规卷曲和转角SD%的蛋白质,以模拟SNF的不同组装状态。
用于监测SNF组装的s-CFW-informed CNN
由于存在固有损耗,分子振动是阻尼振荡(即振动频率是带有负虚部的复数)。当激发频率也是复数(ω?=ω-iτ/2,τ>0,τ是虚拟增益因子)并与分子振动频率匹配时,分子振动的特征可以得到有效增强。基于此,研究人员引入了s-CFW方法,该方法使用傅里叶变换和线性响应的叠加原理从实频光谱中间接合成CFW光谱,无需任何额外测量。
s-CFW本质上是一种基于合成复频重建的光谱放大操作,可以通过虚拟降低等离子体模式和分子振动模式的损耗来增强所有已知/未知光谱,从而增强它们的耦合峰特征的可见度。s-CFW的引入为CNN数据集提供了有效的数据增强,帮助CNN更好地捕捉与蛋白质二级结构相关的光谱特征。对于s-CFW-informed CNN,所有消光光谱(即训练、验证、测试和预测数据集)都使用s-CFW增强程序进行处理。
本研究展示了将基于Gr/Au超表面的红外等离子体传感器与s-CFW-informed CNN相结合的有效性,以解决水环境中纳米级蛋白质二级结构量化的挑战。超表面支持的可调谐且超限域的h-GP通过显著减轻水干扰,能够灵敏地识别SNF的酰胺I和酰胺II带。基于传感器提供的光谱,采用基于迁移学习的物理信息CNN模型来定量预测酰胺I带内重叠的二级结构,而无需大型数据集。物理信息CNN进一步适配s-CFW方法,使检测细微光谱特征的MRE降低了两倍以上,从而允许在SNF组装的成核阶段原位实时监测二级结构变化。
展望未来,该方法的进一步改进将加速实现在生理相关环境中单分子水平上实时跟踪蛋白质构象动态的进展。例如,优化面内间隙宽度可以增强h-GP限域和局部场强度。实现这种纳米结构的均匀和可扩展制造对于未来的器件优化仍然很重要。此外,结合先进的机器学习技术,如注意力机制和自监督学习,有望进一步提高光谱分析灵敏度和模型鲁棒性。
这项研究不仅为解决水溶液中蛋白质二级结构动态监测提供了技术方案,更重要的是为人工智能在生物物理学领域的应用开辟了新途径。通过物理模型与深度学习算法的深度融合,研究人员成功突破了传统光谱分析的技术瓶颈,实现了对纳米尺度生物分子过程的精确解析。这种跨学科的研究方法对未来生命科学、药物研发和材料科学等领域将产生深远影响,特别是在神经退行性疾病机制研究、药物靶点识别和生物材料设计等方面具有广阔的应用前景。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号