
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于ATR-FTIR光谱与机器学习的尿液样本妇科癌症无创早期诊断研究
【字体: 大 中 小 】 时间:2025年05月10日 来源:Clinical and Experimental Medicine 3.2
编辑推荐:
本研究针对妇科癌症早期筛查技术匮乏的临床难题,创新性采用衰减全反射傅里叶变换红外光谱(ATR-FTIR)结合机器学习算法,对309例液体尿液样本进行检测。研究实现了91%的准确率,发现2093 cm-1和1774 cm-1特征峰可作为潜在生物标志物,为开发低成本、非侵入性癌症筛查工具提供了重要技术路径。
妇科癌症的早期诊断一直是临床面临的重大挑战。子宫内膜癌(EC)和卵巢癌(OC)作为高致死率疾病,75%的卵巢癌患者在确诊时已进展至晚期,5年生存率骤降至29%。现有筛查手段如CA-125检测和超声检查存在灵敏度不足的问题,而组织活检具有侵入性。更严峻的是,在发展中国家,即便对宫颈癌(CC)和乳腺癌(BC)这类已有筛查手段的疾病,也因设备昂贵而难以普及。这种背景下,瑞士巴塞尔大学医院Francesco Vigo团队在《Clinical and Experimental Medicine》发表的研究,为破解这一困境提供了创新解决方案。
研究团队开创性地将衰减全反射傅里叶变换红外光谱(ATR-FTIR)与机器学习结合,直接分析液体尿液样本。传统光谱分析多采用干燥样本以规避水分子干扰,但该研究突破技术瓶颈,通过优化测量参数(24次扫描平均、4 cm-1分辨率)成功获取高质量光谱数据。研究纳入309例手术患者样本(103例癌症/206例对照),涵盖EC、OC、CC、BC及外阴癌等多种妇科肿瘤。
关键技术方法包括:采用铂金钻石晶体ATR-FTIR光谱仪(Brucker)直接检测20μL液体尿液;通过Savitzky-Golay滤波和标准正态变量(SNV)变换进行数据预处理;运用正交偏最小二乘(OPLS)降维后,采用网格搜索优化的随机森林模型(21棵决策树、最大深度4)进行分类;通过SHAP值解析特征重要性。
【研究结果】
样本特征分析
队列中癌症患者平均年龄呈现器官特异性分布:卵巢癌患者最年长(中位63岁),乳腺癌最年轻(46岁)。BMI数据显示外阴癌患者最高(35 kg/m2),与已知肥胖风险因素吻合。种族构成以白种人为主(96.6%-100%),反映瑞士本土人群特征。
模型性能验证
随机森林模型在十折交叉验证中展现优异性能:整体准确率91%,对照组分类精确度达100%。关键指标F1-score显示,健康样本识别率95%,癌症样本89%。ROC曲线下面积(AUC)证实模型具有优秀区分能力,克服了样本不平衡的挑战。
生物标志物发现
SHAP值分析锁定三个关键波数:1773 cm-1(可能对应羰基C=O伸缩振动或酰胺I带)、2093 cm-1(氰基C≡N伸缩或胺N-H振动)。非参数检验证实这些峰在健康与癌症组间存在显著差异(p<0.05),其中1773 cm-1峰在对照组中表达更高,可能反映肿瘤导致的蛋白质/脂质代谢紊乱。
技术比较优势
与既往干燥样本研究相比,该液体检测方案将样本前处理时间从数小时缩短至1分钟。特征峰1773 cm-1与Paraskevaidi团队报告的脂质相关峰(1762-1797 cm-1)具有一致性,验证了生物标志物的可重复性。
【结论与讨论】
这项研究确立了ATR-FTIR尿液液体活检在妇科肿瘤筛查中的临床转化潜力。相比传统方法,该技术具备三大突破:1)直接分析液体样本,避免干燥导致的分子构象改变;2)91%的准确率接近现有金标准;3)检测成本降低约90%,适合资源匮乏地区。特征峰1773 cm-1的发现为后续机制研究指明方向,可能涉及肿瘤微环境中的脂质过氧化或蛋白质构象改变。
研究也存在若干局限:样本量仍需扩大以提高亚型分析能力;单一中心数据可能影响模型泛化性;液态水干扰虽被抑制但仍可能掩盖部分信号。团队建议下一步应开展多中心验证,并探索光谱特征与分子分型的关联。这项技术若与微流控芯片结合,有望开发出便携式癌症筛查设备,真正实现"将实验室搬进社区"的医疗愿景。
生物通微信公众号
知名企业招聘