编辑推荐:
膀胱癌(BC)早期检测缺乏特异性标记物,现有尿标记技术敏感性和特异性有限。本研究通过气相色谱 - 离子迁移谱(GC-IMS)分析 89 例 BC 患者和 67 例健康人尿液挥发性有机物(VOCs),利用机器学习构建模型,筛选出 8 种 VOCs 组合,诊断准确率达 91.5%,为 BC 早期诊断提供新方向。
膀胱癌是全球十大常见恶性肿瘤之一,其高发病率和死亡率对公共健康构成严重威胁。目前,膀胱镜检查虽为诊断 “金标准”,但存在有创、费用高及患者依从性低等问题。美国食品药品监督管理局(FDA)批准的 6 种尿标记技术(如 NMP22、BTA 等)特异性和敏感性有限,尤其在血尿患者中易出现假阳性,难以有效区分良性炎症与恶性肿瘤。因此,开发无创、高效的新型诊断方法成为膀胱癌研究的迫切需求。
在此背景下,山东大学齐鲁医院的研究人员开展了一项关于尿液挥发性有机物(volatile organic compounds, VOCs)用于膀胱癌早期检测的研究。该研究成果发表在《Scientific Reports》上,为膀胱癌的无创诊断提供了新思路。
研究人员采用气相色谱 - 离子迁移谱(gas chromatography-ion mobility spectrometry, GC-IMS)技术,对 89 例经病理确诊的膀胱癌患者和 67 例健康对照者的尿液样本进行 VOCs 分析。研究通过随机分配,将样本分为训练集(膀胱癌 64 例、健康对照 45 例)和测试集(膀胱癌 25 例、健康对照 22 例),确保数据的可靠性。
关键技术方法
- 样本采集与处理:收集患者术前新鲜尿液,经离心后保存上清液用于后续分析。
- VOCs 检测:利用 GC-IMS 技术对尿液中的 VOCs 进行分离和检测,获取三维光谱数据(保留指数、迁移时间、峰高),共鉴定出 114 种 VOCs 信号峰。
- 机器学习模型构建:运用随机森林(Random Forests, RF)、支持向量机(SVM)等 5 种算法,基于差异表达的 VOCs 构建诊断模型,并通过受试者工作特征曲线(ROC)评估模型性能。
研究结果
差异表达 VOCs 的筛选
通过曼 - 惠特尼 U 检验,在膀胱癌患者与健康对照者尿液中筛选出 20 种差异表达的 VOCs,其中 17 种上调(如 2 - 十一碳烯醛、2 - 丙酮等),3 种下调(如 2 - 乙基己醇等)。稀疏偏最小二乘判别分析(sPLS-DA)显示,两组样本的 VOCs 谱存在显著差异,提示 VOCs 具有作为诊断标志物的潜力。
机器学习模型性能比较
5 种机器学习模型中,RF 模型表现最优,在测试集中诊断准确率达 91.5%,曲线下面积(AUC)为 0.949,显著高于其他模型(如 SVM 准确率 83.0%、AUC 0.931)。进一步通过基尼系数(Gini coefficient)筛选出 10 种重要 VOCs,经组合优化后,8 种 VOCs(2-Undecenal、2-propanone 等)构建的 RF 模型诊断准确率达 91.5%,AUC 提升至 0.958,特异性为 100%。
关键 VOCs 的生物学意义
研究发现,2 - 十一碳烯醛(2-Undecenal)作为模型中最重要的 VOC,其结构与氧化应激和脂质代谢紊乱密切相关,可能通过激活 NF-κB、MAPK/ERK 等信号通路促进肿瘤进展。此外,1 - 壬醛、1 - 辛醛等 VOCs 在其他肿瘤研究中也被证实与氧化应激或细胞代谢异常相关,提示其在肿瘤诊断中的潜在通用性。
结论与讨论
本研究首次通过 GC-IMS 结合机器学习,建立了基于尿液 VOCs 的膀胱癌诊断模型,筛选出的 8 种 VOCs 组合展现出高准确性和特异性。该方法具有无创、操作简便、可动态监测等优势,为膀胱癌的早期筛查和辅助诊断提供了新的生物标志物组合。
值得注意的是,研究中部分 VOCs(如 2 - 乙基己醇)的代谢机制与肿瘤微环境中成纤维细胞活化相关,提示 VOCs 不仅是代谢产物,还可能参与肿瘤免疫逃逸和炎症反应的调控。然而,研究样本来自单中心且规模有限,未来需开展多中心、大样本研究以验证结果的普适性,并深入探索 VOCs 的具体作用机制。
该研究突破了传统诊断技术的局限性,为膀胱癌的无创诊断开辟了新方向,有望推动 VOCs 在肿瘤早期检测领域的临床转化应用。