
-
生物通官微
陪你抓住生命科技
跳动的脉搏
尿液光谱特征在膀胱癌诊断中的价值:基于荧光光谱与高效液相色谱的多参数机器学习研究
【字体: 大 中 小 】 时间:2025年08月17日 来源:Scientific Reports 3.9
编辑推荐:
本研究针对膀胱癌(BC)诊断中侵入性检查的临床痛点,创新性地采用荧光光谱(EEM)和高效液相色谱(HPLC)技术分析尿液光谱特征。通过建立卷积神经网络(CNN)和OPLS-DA等多参数模型,发现色谱数据训练模型准确率达95.3%,验证了尿液代谢组学结合机器学习在BC无创诊断中的潜力,为开发新型筛查工具提供了重要依据。
膀胱癌是全球范围内致死率较高的恶性肿瘤,2022年造成超过22万人死亡。目前临床诊断主要依赖侵入性的膀胱镜检查和组织病理学分析,这些方法不仅给患者带来不适,还存在诊断周期长、费用高等问题。尽管已有基于尿液的非侵入性检测方法(如BTA Stat、NMP22等)获得FDA批准,但其敏感性和特异性普遍不足90%,难以完全替代传统检查手段。这种临床困境催生了研究者对新型诊断技术的探索。
来自斯洛伐克布拉迪斯拉发圣西里尔和迪乌斯医院(UNB Hospital of St. Cyril and Methodius in Bratislava)的Martina Velísková团队在《Scientific Reports》发表研究,创新性地将尿液光谱分析与人工智能技术相结合。研究人员假设膀胱癌细胞代谢改变会导致尿液成分变化,进而影响其光谱特性。通过比较膀胱癌患者与对照组的尿液样本,运用荧光光谱、高效液相色谱等技术获取代谢指纹,并采用机器学习方法建立诊断模型,为开发高精度的无创诊断工具提供了新思路。
研究采用三项关键技术:1)荧光光谱法测量200-800nm波长范围的激发-发射矩阵(EEM);2)反相高效液相色谱(HPLC)结合吸收和荧光检测器分析尿液代谢物;3)应用逻辑回归、OPLS-DA和卷积神经网络(CNN)等算法构建分类模型。样本来自123例经病理确诊的膀胱癌患者和85例对照者的晨尿标本。
【Excitation-emission matrices】研究首先构建了尿液的三维荧光光谱图,通过峰分析和区域分析两种方法提取特征。未标准化数据未能显示显著差异峰,但经肌酐标准化后所有荧光峰均呈现统计学差异。ROC分析显示标准化峰的最高AUC仅0.65,单独荧光特征诊断效能有限。
【Fluorescence peak analysis】对9个荧光峰的多变量分析中,440/520nm峰最具鉴别价值。结合年龄和性别参数后,逻辑回归模型AUC提升至0.71,显示人口统计学因素可增强模型性能。OPLS-DA分析获得65.7%的准确率,证实多参数联合分析的优势。
【Fluorescent area analysis】将EEM划分为372个区域后,发现92个肌酐标准化区域存在组间差异。CNN模型训练准确率达72.1%,但验证特异性仅51%,表明存在过度拟合风险。该结果提示单纯荧光信号难以实现可靠诊断。
【Chromatographic analysis】HPLC分析取得突破性进展,从吸收色谱中鉴定出37个显著差异峰,荧光色谱发现15个差异峰。最具鉴别力的色谱峰AUC达0.76,显著优于荧光指标。
【Analysis of peaks】吸收色谱的37个差异峰和荧光色谱的15个差异峰经ROC评估,最佳色谱峰组合使AUC提升至0.76。OPLS-DA模型准确率达80.8%,显示色谱特征具有更高诊断价值。
【Analysis of areas】将30分钟色谱图划分为60个时段进行分析,CNN训练模型创下95.3%的惊人准确率,验证模型也保持88.2%的准确度,证实色谱时域特征蕴含丰富诊断信息。
研究结论指出,尿液HPLC色谱结合CNN分析展现出优异的诊断性能,其95.3%的训练准确率超越了现有FDA批准检测方法。尽管荧光光谱单独应用效果有限,但与色谱数据联合分析可提供互补信息。该研究的创新点在于:1)首次系统比较了尿液EEM和HPLC在BC诊断中的价值差异;2)证实肌酐标准化可能引入数据相关性,建议同时使用原始值和标准化值;3)建立了目前文献报道最高精度的色谱诊断模型。这些发现为开发基于尿液代谢指纹的无创诊断试剂盒奠定了方法学基础,未来通过扩大样本量和优化算法,有望实现膀胱癌的早期筛查和动态监测。
生物通微信公众号
知名企业招聘