基于胃液拉曼光谱与机器学习整合策略的胃癌及幽门螺杆菌早期精准诊断新方法
《Scientific Reports》:Raman spectroscopy and machine learning for early detection of gastric cancer and Helicobacter pylori with gastric juice
【字体:
大
中
小
】
时间:2025年10月18日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对胃癌早期诊断及幽门螺杆菌(HP)感染检测的临床难题,开发了一种基于胃液拉曼光谱结合机器学习堆叠模型的非侵入性诊断技术。该技术通过分析133例患者胃液样本,实现了对慢性浅表性胃炎(CSG)、肠上皮化生(IM)、异型增生(DYS)和早期胃癌(EGC)的精准区分(准确率90%),同时HP感染检测准确率达96%,为胃癌早期筛查提供了快速、微创的创新解决方案。
胃癌是全球第五大常见癌症和第二大癌症死亡原因,早期诊断对降低死亡率至关重要。然而,当前金标准——内镜活检存在侵入性、操作复杂和采样误差等局限;血清学标志物对早期病变灵敏度不足,影像学和液体活检则受成本与技术难度限制。幽门螺杆菌(HP)作为I类致癌物,其检测方法(如尿素呼气试验)也存在准确性不足的问题。胃液作为直接反映胃黏膜状态的生物流体,蕴含蛋白质、代谢物和微生物组分等 biomarker,但尚未被充分开发用于诊断。
研究人员创新性地将拉曼光谱技术与机器学习结合,通过对胃液样本进行分子特征分析,实现了胃癌前病变和早期癌变的非侵入性诊断。该研究纳入北京大学第三医院133例患者,根据病理诊断分为CSG、IM、DYS和EGC组,并依据HP感染状态进一步分组。通过采集胃液样本,使用532 nm激光的共聚焦拉曼光谱仪获取光谱数据,结合多种机器学习算法(包括MLP、GRU、ANN和GB等)构建分类模型,最终采用堆叠模型优化性能。
关键技术方法包括:1) 胃液样本离心预处理与拉曼光谱采集(波长范围400-3200 cm-1);2) 光谱数据预处理(去宇宙射线、平滑化和基线校正);3) 多种机器学习算法(如t-SNE、PCA、LDA、OPLS-DA)进行特征提取与降维;4) 堆叠模型整合最优算法(MLP、GRU、KNN、GB)进行病理分期与HP感染状态预测;5) 统计分析采用ANOVA与Bonferroni检验验证光谱峰值差异。
通过平均光谱分析发现,尽管各组光谱形态相似,但特定拉曼峰强度存在差异。多维降维分析(t-SNE、PCA、LDA和OPLS-DA)显示CSG、IM、DYS和EGC组间存在明显聚类趋势,表明拉曼光谱能有效区分病理阶段。
堆叠模型在病理分期中表现优异,准确率达90%,敏感性90%,特异性97%。ROC曲线显示CSG、IM、DYS和EGC的AUC值分别为0.95、0.91、0.91和0.96。MLP模型对上皮内瘤变(DYS+EGC)的鉴别能力尤突出,AUC达0.98。
分析发现,腺嘌呤(717 cm-1)、苯丙氨酸(1003 cm-1)和葡萄糖(1343 cm-1)的峰值随病变进展(CSG→IM→DYS→EGC)逐步升高,而酰胺III(1235 cm-1)信号逐渐减弱,提示蛋白质结构完整性丧失。这些分子变化反映了细胞增殖与代谢重编程的恶性转化过程。
OPLS-DA和LDA分析显示HP+与HP-样本间存在显著差异。堆叠模型在HP感染诊断中准确率达96%,敏感性96%,特异性96%,AUC为0.94。
HP+组显示磷脂酰肌醇(415 cm-1)和腺嘌呤(717 cm-1)峰值显著升高,可能与HP激活PI3K信号通路刺激细胞增殖相关。
研究结论表明,胃液拉曼光谱结合机器学习能高效区分胃黏膜病变阶段和HP感染,提供了一种微创、快速的诊断工具。分子特征分析揭示了病变进展中的代谢变化(如腺嘌呤和葡萄糖升高),为早期干预提供了量化指标。尽管存在样本量单中心限制,该技术展示了内镜整合潜力,可通过光纤探针实现实时原位诊断,未来多中心验证将推动其临床转化,助力胃癌防控。
论文发表于《Scientific Reports》,作者包括Fu Weiwei、Zhang Yuxin等,通讯作者为Zhang Jing、Wang Jing和Ding Shigang。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号