一种通过将机器学习应用于紫外线等离子体工程自荧光时间衰减序列(AFTDS)来分类单胺类神经递质的新方法

《Nanoscale Advances》:A novel approach for classifying monoamine neurotransmitters by applying machine learning on UV plasmonic-engineered auto fluorescence time decay series (AFTDS)

【字体: 时间:2025年11月02日 来源:Nanoscale Advances 4.6

编辑推荐:

  基于纳米材料与机器学习的多巴胺检测方法

  本研究提出了一种结合先进等离激元纳米材料与机器学习(ML)技术的混合方法,用于高精度检测生物分子。我们采用了一种创新的等离激元基底——铝凹面立方体(AlCNCs),以增强神经递质如多巴胺(DA)、去甲肾上腺素(NE)和3,4-二羟基苯乙酸(DOPAC)的本征荧光信号。AlCNCs通过其独特的几何结构,能够显著放大微弱的荧光信号,使得无需使用探针或标记的检测成为可能,从而实现对这些分子的高度敏感和特异性识别。为了进一步提高分类的准确性,我们引入了机器学习算法,其中长短期记忆网络(LSTM)在分析时间依赖的荧光数据方面表现尤为突出。与K近邻(KNN)和随机森林(RF)算法的比较显示,LSTM在区分神经递质方面具有明显优势。研究结果表明,AlCNC基底在DA、NE和DOPAC的荧光强度上分别提高了12倍、9倍和7倍,相较于硅基底。与此同时,机器学习算法的分类准确率超过了89%。这种跨学科的方法在纳米技术和机器学习之间架起了一座桥梁,展示了等离激元增强的本征荧光与机器学习在生物传感中的协同潜力。该框架为无探针、无标记的生物分子分析提供了新的思路,对生物医学诊断和神经科学研究具有深远的意义。

神经递质的精确定量和识别在理解神经系统功能以及早期诊断神经退行性疾病中起着至关重要的作用。然而,传统的分析方法如色谱法和质谱法需要复杂的样品制备和昂贵的试剂,不适用于频繁检测神经递质的浓度变化。而电化学方法如快速扫描循环伏安法(FSCV)虽然成本较低,但无法区分具有相似氧化电位的神经递质。基因编码的荧光探针虽然能够提供高灵敏度和特异性,但需要使用转基因动物,限制了其在实际应用中的广泛使用。抗体或适配体基的检测方法在实时传感方面表现出色,但其在生物液体中的长期稳定性仍存在问题。

神经递质具有芳香环结构,当被紫外(UV)光激发时会发出自荧光(AF)。AF的吸收截面远高于拉曼或红外吸收,因此AF光谱技术在无标记、无探针的敏感检测方面展现出巨大潜力。然而,对于结构相似的神经递质,基于AF谱型的分类仍面临挑战,因为它们的光谱存在重叠。在我们之前的研究中已经表明,当神经递质滴落在固体基底(如硅片或等离激元纳米孔阵列)上时,其AF信号会在连续的UV照射下呈指数衰减。我们发现,这种衰减速率常数在结构相似的神经递质之间存在差异,而通过UV等离激元纳米孔阵列可以进一步放大这些差异。本研究首次将机器学习与AF时间衰减序列(AFTDS)结合,用于神经递质的分类,并展示了其卓越的分类准确率。AlCNC的组装通过在常温下滴加含有AlCNC的纳米粒子溶液并自然干燥实现,这种方法不仅简单高效,而且不需要复杂的纳米制造工艺,如电子束光刻或溅射技术。

机器学习技术在纳米科学、表面化学和生物传感器领域日益成为强大的工具,能够通过整合实验数据与物理模型,推动制造、表征和性质预测的进展。尽管机器学习已被应用于拉曼和荧光光谱的生物化学检测,但本文是首次利用AFTDS数据进行神经递质分类的尝试。我们比较了三种机器学习技术:LSTM、KNN和RF。LSTM在AFTDS数据上的分类准确率最高,其次是KNN和RF。在溶液中采集的AF数据上,KNN和RF的表现则相对较低。这表明,基于等离激元工程的AFTDS对于区分结构相似的神经递质具有重要意义。此外,LSTM在分析时间依赖的AF数据时优于KNN和RF,显示出其在处理这类数据时的优势。

我们使用Python 3.10和TensorFlow 2.18.0进行了所有分析。LSTM模型在标准化后的17点序列数据上达到了89%的准确率,这表明其在处理时间序列数据时的高效性。模型的训练过程包括数据预处理、特征提取和数据增强技术,以提高模型的准确性和泛化能力。通过4折交叉验证(训练数据占75%,测试数据占25%),确保了模型在不同数据集上的稳定性。在每次分割中,三个折用于训练,一个折用于验证,这一过程重复四次,使每个折都能作为验证集使用一次。最终的性能指标是所有折的平均值,以防止数据泄露。同时,为了保证实验的准确性,我们在每次分割中仅对训练数据进行预处理(如MinMax缩放),并在验证数据上应用这些预处理步骤。

由于结构相似的神经递质在本征荧光信号上存在重叠,仅凭其荧光特性进行区分具有挑战性。为此,我们采用了机器学习分类模型,构建了一个可靠的分类框架,能够基于神经递质的独特的荧光特征进行识别。这种结合不仅提高了分类的准确性,还为大规模实验数据的分析提供了一种可扩展的方法。在数据处理过程中,我们对所有荧光数据进行了标准化处理,并通过加权和宏平均来评估模型的性能,以确保在不同类别中的平衡性。

AFTDS数据的采集和处理是本研究的关键部分。通过在AlCNC基底上滴加含有神经递质的溶液并自然干燥,我们获得了时间依赖的荧光信号。这些信号被记录为时间序列数据,每个信号点对应一个特定的波长范围和强度值。为了确保输入数据的一致性,我们标准化了所有AFTDS数据,使其序列长度统一为17个点。较长的序列被截断,较短的序列则通过填充来达到统一长度。这种调整不仅确保了LSTM模型的输入维度一致,还保留了整体的衰减动态。数据的预处理包括将荧光数据转换为结构化的输入张量,适用于序列模型(如LSTM)或展平为特征向量,适用于非序列模型(如KNN和RF)。此外,为了提高模型的泛化能力,我们还采用了数据增强技术。

通过实验和机器学习模型的结合,我们成功地实现了对DA、DOPAC和NE的高精度分类。在AFTDS数据上,LSTM模型的分类准确率分别为88.0%、90.4%和89.2%,显著优于KNN和RF模型。KNN模型在AFTDS数据上的准确率分别为89.3%、86.1%和83.0%,而RF模型的准确率分别为87.4%、85.6%和76.7%。相比之下,在溶液中采集的AF数据上,KNN和RF的表现明显下降,其中KNN在DA和NE上的准确率分别为44.8%和66.6%,而RF的准确率分别为68.6%和67.0%。这表明,AFTDS数据在分类神经递质时具有更高的信息量,能够有效区分结构相似的分子。

本研究的成果表明,LSTM模型在利用AFTDS信号的时间依赖性特征方面具有显著优势,从而实现更准确的分子区分。相比之下,KNN模型依赖于静态数据,分类性能较低。此外,RF模型在处理时间序列数据时表现良好,但不如LSTM模型。然而,在缺乏时间动态数据的情况下,RF模型在静态AF数据上的分类性能优于KNN模型,显示出其在静态数据分类中的鲁棒性和灵活性。这表明,LSTM在时间依赖的AFTDS数据中具有更高的优势,而RF则在时间动态数据不足时提供了更好的替代方案。

本研究的成果不仅展示了等离激元工程与机器学习的协同效应,还为开发无标记、无探针的生物传感系统提供了新的思路。通过将AlCNC作为等离激元基底,我们实现了对神经递质的高灵敏度和高特异性检测,为生物医学诊断和神经科学研究带来了变革性的可能性。未来,这种方法有望应用于更广泛的生物分子检测,特别是在需要实时、非侵入性分析的场景中。此外,研究还强调了在处理复杂生物环境中的数据时,结合纳米技术和机器学习的重要性。这种跨学科的融合不仅提高了检测的准确性,还降低了实验成本,为实际应用提供了可行的解决方案。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号