表面增强拉曼光谱结合机器学习:一种精准快速的脑积水诊断新工具
《Scientific Reports》:Surface enhanced Raman spectroscopy and machine learning as an accurate and rapid diagnostic tool for hydrocephalus
【字体:
大
中
小
】
时间:2025年12月17日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对新生儿及儿童脑积水早期诊断困难的问题,开发了一种基于表面增强拉曼光谱(SERS)与机器学习(ML)的快速诊断方法。研究人员利用银纳米颗粒纤维素试纸条和便携式拉曼光谱仪分析脑脊液(CSF)样本,通过优化的随机森林(RF)算法在盲测中达到97%的准确率。该技术具有操作简便、检测快速(5分钟)、便携性强等优势,为资源有限地区的脑积水早期诊断提供了创新解决方案。
在神经科学领域,脑积水一直是一个严峻的挑战。这种以脑脊液在脑室内异常积聚为特征的神经系统疾病,全球每500名新生儿中就有1例发病,在非洲、亚洲和南美洲的许多发展中国家,这一比例甚至高达1:100。脑积水不仅导致颅内压升高和神经功能缺损,还会造成巨大的社会和经济负担。更令人担忧的是,新生儿和儿童的早期诊断尤为困难,因为头围增大等主要诊断指标往往出现较晚,延误了最佳干预时机。
传统诊断方法主要依赖影像学检查,但这类设备在资源有限地区往往难以普及。而脑脊液作为直接反映大脑生理状态的生物样本,蕴含着丰富的疾病信息。此前的研究已经发现,脑积水患者的脑脊液成分会发生显著改变,特别是与脑叶酸代谢相关的通路出现异常。这为开发基于脑脊液分析的诊断方法提供了理论依据。
正是在这样的背景下,曼彻斯特大学的研究团队独辟蹊径,将表面增强拉曼光谱(SERS)与机器学习技术相结合,开创了一种全新的脑积水诊断方法。这项创新性研究发表于《Scientific Reports》杂志,为脑积水的早期诊断带来了革命性的突破。
研究团队采用的核心技术方法包括:使用银纳米颗粒纤维素试纸条作为SERS基底,利用便携式MiniRaman光谱仪(785 nm激光)进行检测,收集了来自三家医疗中心的117例儿科脑脊液样本(70例对照,47例脑积水患者);通过网格搜索优化多种机器学习算法(线性判别分析LDA、二次判别分析QDA、支持向量机SVM和随机森林RF),采用受投资组合理论启发的评分系统评估模型性能,重点考察加权平衡准确率并惩罚过拟合现象。
脑积水与对照组患者的CSF指纹图谱使用SERS分析
研究人员首先评估了银纳米颗粒试纸条的重复性和再现性。标准化后,试纸条内和试纸条间的变异系数分别达到1.50%和2.08%,优于通常SERS基底5-25%的相对标准偏差,表明其具有足够的均匀性用于本研究。更重要的是,添加脑脊液后拉曼信号强度平均提高了61.89倍,确保诊断结果不受基底干扰。
通过对118例患者脑脊液样本的SERS分析发现,对照组和脑积水组的平均变异系数分别为60.28%和65.02%。这种差异反映了脑脊液成分的复杂性以及纳米颗粒与生物分子相互作用的可变性。均值光谱比较显示,对照组在600 cm-1、790 cm-1和1350 cm-1处强度更高,这些振动与脂质、蛋白质和C-C伸缩相关;而脑积水组在710 cm-1、1320 cm-1以及1540 cm-1和1690 cm-1区域(对应酰胺I带)表现出更高强度。这些差异揭示了脑积水患者脑脊液潜在的生化特征改变。
研究人员采用主成分分析(PCA)、偏最小二乘法(PLS)和随机森林(RF)三种方法进行降维和特征选择。PCA分析需要22个主成分才能解释95%的方差,前三个成分覆盖52%的数据。PLS分析显示潜在变量1(LV1)的Fisher比达到2.35,表明其对两组区分具有良好效果。而RF特征选择确定了800 cm-1和1476 cm-1附近的两个主要特征区域,这些区域在二维散点图中显示出比PCA和PLS更清晰的聚类效果。
研究团队开发了一套完整的模型选择和验证流程。首先将数据按患者分层分为训练验证集(70%)和测试集(30%),然后通过网格搜索优化各种算法的超参数。每个模型通过10折分层交叉验证进行评估,采用独特的评分系统:计算加权平衡准确率的中位数,并减去训练与验证准确率之差的惩罚项(λ=2),以此选择泛化能力最强的模型。
最终,随机森林模型(2000棵树,最大树深度2,内部节点最小分裂样本数30,叶节点最小样本数15,特征子采样策略为'log2')表现最佳,测试加权平衡准确率达到97.73%,总体准确率97.22%,特异性95.45%,精确度93.33%,敏感度/召回率100%。一旦训练完成,RF算法仅需0.37秒即可完成样本分类。相比之下,表现次优的PCA-SVM模型准确率为88.89%。性能差异主要源于降维技术而非分类算法本身。
特征重要性热图显示,最重要的判别区域集中在600 cm-1、710-720 cm-1、750-780 cm-1、1000-1075 cm-1、1250-1300 cm-1、1470-1500 cm-1和1700-1750 cm-1附近,这些区域恰好对应两组均值光谱的明显差异区域。RF分类器不仅依赖孤立的判别特征,还能整合广泛光谱区间内的累积生化差异信号。
这项研究成功证明了SERS与机器学习结合在脑积水诊断中的巨大潜力。该方法样本前处理简单、材料易得、分类模型可解释性强,为脑积水特异性脑脊液成分/代谢改变提供了一种准确、可解释的诊断工具,诊断准确率达到97.22%。100%的敏感度和95.45%的特异度使其成为检测脑积水这种危及生命疾病的可靠方法。
该研究的创新之处在于其网格搜索机器学习工作流程和评分系统,不仅可用于其他疾病的诊断,还可应用于需要振动光谱解释的领域,如生物制药行业。研究方法的选择源于先前发现的脑积水患者脑脊液成分和脑代谢的显著变化,特别是与中枢叶酸代谢循环和10-甲酰基四氢叶酸脱氢酶(FDH,又称ALDH1L1)相关的变化。
从样本量角度看,当前研究使用了117例新生儿脑脊液样本,虽然模型表现出色,但更大规模的患者队列将进一步提高和验证该方法的可靠性。学习曲线显示,即使在最大训练规模下,验证性能仍在持续改善,表明模型稳健但仍受数据量限制。
技术层面,银纳米颗粒试纸条为拉曼分析提供了一个可转化的平台,但使用其他形貌的纳米颗粒或复合结构可能提供更高的强度和重复性。结合映射策略或互补分析技术,如质谱和核磁共振,或标记纳米颗粒与分子标签,可能进一步提高诊断准确性。
总之,这项研究展示了一种快速、可解释的脑积水诊断方法,通过使用RF在保持模型透明度的同时实现了高诊断准确率。随着临床SERS领域的进步,这种方法不仅对脑积水有希望,对其他需要可及、准确和可解释诊断的神经系统疾病也具有重要意义。未来的研究重点应放在基底标准化、模型泛化以及与互补技术的验证上,以将这些发现转化为临床可行的诊断工具。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号