无标记血清SERS技术与RFE-GBDT算法结合,用于肝癌的非侵入性筛查
《Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy》:Label-free serum SERS combined with RFE-GBDT algorithm for non-invasive screening of liver cancer
【字体:
大
中
小
】
时间:2026年02月07日
来源:Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy 4.3
编辑推荐:
基于表面增强拉曼光谱(SERS)与递归特征消除-梯度提升决策树(RFE-GBDT)模型的肝癌五阶段分类诊断研究,准确率达92.68%。通过LIME算法解析关键拉曼波段,证实血清非侵入式检测在肝癌筛查中具有高效性和可行性。
Jingjing Gao|Tianyi Lv|Xianqiong Gong|Xingen Gao|Wei Qiao|Fuqiang Wang|Junzheng Wu|Juqiang Lin
厦门理工学院光电与通信工程学院,中国福建省厦门市
摘要
肝癌的早期诊断对于制定临床治疗策略和提高患者生存率至关重要。然而,目前的诊断方法往往具有侵入性、复杂性高且耗时较长,因此不适合在实际环境中进行早期筛查。因此,迫切需要开发高效便捷的非侵入性诊断技术。本研究提出了一种基于表面增强拉曼光谱(SERS)和深度学习算法的非侵入性光学诊断方法,用于肝癌的分期识别和辅助筛查。我们系统地收集了不同分期肝癌(T1、T2、T3)、乙型肝炎(HBV)患者以及健康对照组(Normal)的血清样本的高质量SERS光谱数据。采用递归特征消除(RFE)进行特征选择,去除了冗余的光谱带,保留了与分类高度相关的特征,从而显著提高了模型的区分能力。选定的特征被输入到梯度提升决策树(GBDT)模型中。通过残差迭代优化,该模型有效捕捉了非线性特征相互作用,并使用局部可解释模型不可知解释(LIME)算法对关键光谱带进行了解释。与其他常用分类器(如逻辑回归(LR)和随机森林(RF)相比,RFE-GBDT模型在肝癌分期任务中表现出更优的性能,五类分类的准确率达到92.68%。结果表明,将SERS技术与RFE-GBDT算法相结合,为肝癌的早期诊断提供了一种高效且非侵入性的辅助工具。
引言
自20世纪70年代以来,肝癌的发病率一直在稳步上升,预计至少会持续到2030年[1]。在发展中国家,肝病的患病率更高,风险因素包括乙型肝炎病毒(HBV)和丙型肝炎病毒(HCV)[2]、[3]。由于早期阶段缺乏典型的临床症状,大多数患者在晚期才被诊断出来[4],仅有5%至15%的患者适合接受手术切除。其余患者主要依赖化疗和免疫疗法,但这些方法的效果有限,导致生存率显著降低[5]、[6]。因此,早期筛查对于改善肝癌预后和降低复发率至关重要。目前的诊断方法包括血清学检测(针对HBV、HCV和AFP)以及影像学检查(如超声、CT和MRI)[7]。然而,这些方法存在局限性,包括复杂性、依赖专业医生、成本高昂以及检测早期肝癌的敏感性不足,这凸显了迫切需要更便捷、高效和准确的检测方法。
表面增强拉曼散射(SERS)技术以其高度敏感的分子检测能力而备受关注,为肝癌的非侵入性筛查和诊断提供了有希望的途径。SERS利用了纳米材料(如金和银)的表面增强效应,可以将拉曼信号放大10^6到10^14倍,表现出优异的信号重复性[8]、[9]、[10]。与传统诊断方法相比,SERS在灵敏度、特异性和无标记检测方面具有显著优势,在化学检测[11]、食品安全[12]、生物医学[13]、[14]和环境分析[15]领域展现出巨大潜力。然而,SERS数据的分析常常受到噪声干扰和实验条件变化的影响,光谱信息的复杂性要求与先进的机器学习算法和深度学习相结合以实现有效的分类和解释。Sun等人将SERS与主成分分析-线性判别分析(PCA-LDA)和偏最小二乘支持向量机(PLS-SVM)结合,成功区分了早期(T1–T2)和晚期(T3–T4)的肝癌[16]。Cheng等人开发了一种基于深度学习的卷积神经网络(CNN)分类器,利用SERS技术对正常个体、乙型肝炎(HB)和肝癌患者进行分类[17]。Yang等人将SERS与小波变换和深度学习结合,对肝癌患者和正常个体进行分类[18]。尽管在肝癌SERS光谱分析方面取得了进展,但仍存在挑战。SERS光谱数据通常包含数百到数千个波数,且样本量相对较小,具有高维和小样本的特点[8]、[9]。此外,光谱数据常常包含冗余信息、噪声和低区分度的带,这可能导致分类模型过拟合。无监督降维方法(如主成分分析(PCA)已被广泛使用[16]、[19],但其方差最大化方法可能会忽略具有低方差但高区分能力的特征[20]、[21]。相比之下,递归特征消除(RFE)通过与分类器的协作迭代评估特征贡献,可以有效去除冗余带并保留高维光谱中的区分特征[23]。梯度提升决策树(GBDT)通过残差迭代优化,有效捕捉了非线性特征相互作用[24],特别适合处理SERS光谱中的复杂分子振动模式。
在这项研究中,我们开发了一种基于表面增强拉曼光谱(SERS)和递归特征消除(RFE)以及梯度提升决策树(GBDT)的有效肝癌分期模型。RFE算法用于光谱数据的降维,选择最具区分能力的特征。随后,使用GBDT分类器进行迭代带选择,构建了一个五类肝癌SERS模型,包括正常、乙型肝炎(HBV)和三个分期(T1、T2、T3)。该模型在分类健康对照组、慢性乙型肝炎(HBV)以及不同分期的肝癌(T1、T2、T3)方面表现出高准确率。此外,还使用了局部可解释模型不可知解释(LIME)算法来识别关键区分带,突出了每种疾病阶段的特定分子振动特征。基于这些发现,为了进一步评估该方法在实际应用中的可行性,所提出的基于血清的无标记SERS方法与常规临床血液采集工作流程高度兼容,无需复杂的样本预处理或额外的侵入性程序。这种兼容性表明,该方法作为肝癌筛查和分期的辅助工具具有良好的可行性,适用于未来的前瞻性和多中心临床研究。
部分摘录
样本制备
血清样本来自厦门中医院。研究队列包括81名肝癌(LC)患者,其中22名患者为I期(T1),21名为II期(T2),38名为III期(T3)。此外,还收集了57名乙型肝炎病毒(HBV)患者和78名健康志愿者(Normal)的血清样本作为对照。人类血液实验遵循伦理指南进行,所有志愿者
光谱分析
为便于理解,本文将正常个体标记为“Normal”,乙型肝炎病毒(HBV)患者标记为“HBV”,I期、II期和III期肝癌患者分别标记为“T1”、“T2”和“T3”。图3(A)显示了正常组(n = 79)、HBV组(n = 57)、T1组(n = 21)、T2组(n = 22)和T3组(n = 36)在400–1800 cm?1范围内的平均SERS光谱和标准差。实线代表平均光谱,阴影区域代表标准差。
结论
在这项研究中,利用带有AgNPs基底的血清无标记SERS光谱结合机器学习算法,对正常个体、HBV患者和I-III期肝癌患者进行了五类诊断分类。在496、638、813、887、1009、1207、1331和1580 cm?1处观察到五组之间的平均SERS光谱存在显著差异。我们比较了原始数据和经过PCA及RFE特征处理后的数据分类性能
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。
致谢
本工作得到了福建省自然科学基金(编号:2023J011456、2023J05084)、厦门市自然科学基金(编号:3502Z202373057)、福建省科技计划国际合作项目(编号:2024I0045)、厦门市自然科学基金(3502Z202471074)、福建省中青年教师教育科研项目(编号:JZ240063)的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号