编辑推荐:
慢性萎缩性胃炎(CAG)是胃癌(GC)的重要前体病变,现有评估 GC 风险的方法存在局限。研究人员利用青岛大学附属医院病历构建预测 CAG 进展为 GC 风险的机器学习模型。结果显示模型性能良好,为 CAG 患者分层管理和 GC 早期防治提供帮助。
在医学的奇妙世界里,胃癌(GC)如同一个可怕的 “幽灵”,严重威胁着人类的健康,其发病率和死亡率在各类癌症中都名列前茅。而慢性萎缩性胃炎(CAG)作为胃癌的重要前体病变,就像是通往胃癌这条危险道路上的一个关键 “路口” 。目前,临床上评估 CAG 患者患胃癌风险的方法主要是定期的内镜检查和肿瘤标志物检测。然而,内镜检查属于侵入性操作,患者接受度低,频繁检查不仅让患者身体难受,还会带来高额的经济负担;肿瘤标志物检测虽然相对方便,但某些标志物的特异性和敏感性还有待提高,很多基层医疗机构在设备和技术上也存在限制,难以进行高质量的内镜检查和精准的肿瘤标志物检测。这些问题就像一道道屏障,阻碍了对 CAG 患者患胃癌风险的高效、准确评估。
为了解决这些难题,青岛大学的研究人员勇挑重担,开展了一项极具意义的研究。他们致力于构建一个成本效益高、高效且准确的模型,用于评估 CAG 患者患胃癌的风险。研究成果发表在《Discover Oncology》杂志上,为该领域带来了新的曙光。
研究人员为开展这项研究,主要运用了以下关键技术方法:首先,从青岛大学附属医院收集了 2016 年 1 月 1 日至 2022 年 12 月 31 日期间 CAG 和 GC 患者的病历。然后,从收集的临床病例数据中挑选出性别、年龄和 20 项常见实验室指标作为相关因素变量,并进行预处理。利用 R 软件中的 “glmnet” 包进行最小绝对收缩和选择算子(LASSO)回归分析,筛选出关键风险因素 。在此基础上,以确诊的 GC 状态为二元因变量,纳入 10 个自变量,运用二元逻辑回归构建预测模型,还用了多种方法评估模型性能。
下面来看看具体的研究结果:
- 数据基本特征:研究共纳入 350 名患者,其中 CAG 患者 150 名,GC 患者 200 名。通过 LASSO 回归分析,确定了 22 个因素变量中有 10 个在模型中具有非零系数,包括性别、凝血指标(如凝血酶原时间、纤维蛋白原、D - 二聚体、TT 比值 )、血细胞指标(如平均红细胞体积、血红蛋白、血小板 )以及血脂水平(如高密度脂蛋白、甘油三酯 )。
- 模型结构:基于筛选出的 10 个因素变量,成功构建了二元逻辑回归模型。该模型的一致性指数(C-index)为 0.895(95% 置信区间 0.863 - 0.927),显示出良好的预测能力。构建的诺莫图能直观评估 CAG 患者患癌风险,其定性和定量受试者工作特征曲线(ROC)的曲线下面积(AUC)分别为 0.853 和 0.892,校准曲线在中等概率范围内预测精度较高,决策曲线分析(DCA)表明在阈值概率 0.04 - 0.96 范围内,该模型具有决策优势。
在研究结论和讨论部分,研究人员成功构建了 CAG 癌变风险评估模型,确定了一系列关键风险因素。性别在 CAG 癌变过程中作用不可忽视,男性患 GC 的概率更高,可能与雌激素的保护作用以及男女生活习惯差异有关;凝血相关指标纳入模型,意味着凝血系统异常在 CAG 癌变中可能起关键作用;血细胞相关指标反映出身体造血微环境和血液成分在疾病发展过程中可能发生变化并参与癌变;血脂相关指标表明异常脂质代谢与 CAG 癌变密切相关 。不过,研究也存在一些不足,如数据收集有限、样本量较小,导致未进行全面的验证。未来研究需要扩大样本量、完善验证过程、深入探索各因素作用机制,进一步优化模型。
这项研究意义重大,它为 CAG 癌变风险评估提供了新的模型和思路,虽然模型存在一定局限性,但通过合理应用,能为临床医生对 CAG 患者进行分层管理提供有力支持,有助于实现 GC 的早期预防和精准治疗,推动该领域的研究不断向前发展,为更多患者带来希望。