AI 决策树模型:精准破解卵巢癌良恶性密码,开启早期诊断新征程

【字体: 时间:2025年02月21日 来源:BMC Medical Informatics and Decision Making 3.3

编辑推荐:

  为解决卵巢癌早期诊断难题,中南大学湘雅三医院的研究人员开展构建预测卵巢癌良恶性决策树模型的研究。结果显示该模型预测价值更高。推荐阅读,助您了解卵巢癌诊断新方向,洞察 AI 在医学领域的创新应用。

  
在女性健康的 “保卫战” 中,卵巢癌堪称一颗极具威胁的 “定时炸弹”。它是全球第七大常见癌症,在妇科癌症致死原因里仅次于宫颈癌,死亡率与发病率之比超过 0.6。想象一下,每 6 个被诊断出卵巢癌的女性中,就约有 1 人在短短三个月内离世,这数据实在让人揪心。

目前,卵巢癌的临床诊断主要依赖于影像学检查和肿瘤标志物检测。但这些方法都有自己的 “短板”。影像学检查(如 CT、MRI 等)很难准确区分肿瘤的良性和恶性;经阴道超声(TVUS)结合二维阴道彩色多普勒超声,也只能检测出约 17% 的卵巢肿瘤患者。而卵巢肿瘤标志物,像 CA125、HE4 以及由 HE4 和 CA125 组合而成的 ROMA 指数,在诊断早期卵巢癌时,敏感性和特异性都不高,在 I 期卵巢癌的诊断敏感性还不到 50%。

常规血液检查作为临床中简单、经济又方便的检查项目,主要测量白细胞、血小板和红细胞相关指标,能快速反映患者采血时的血液状态和炎症情况。已有研究显示,它在肿瘤的诊断和预后评估方面有一定价值,可在卵巢癌早期诊断上,其作用还不明确。为了攻克卵巢癌早期诊断的难题,中南大学湘雅三医院的研究人员在《BMC Medicine》期刊上发表了题为《Construction and validation of a decision tree model for predicting the malignancy of ovarian cancer based on routine blood tests and clinical markers》的论文。他们通过研究分析,构建了一个决策树模型,试图更准确地预测卵巢癌的良恶性,这对于提高卵巢癌患者的预后有着重要意义。

研究人员为了开展这项研究,采用了多种关键技术方法。他们回顾性分析了大量卵巢癌患者的信息,通过 B 超、CT 或 MR 检查来诊断病情。计算 ROMA 指数时,依据患者的绝经状态以及 HE4 和 CA125 的浓度进行。构建决策树模型则基于分类和回归树(CART)分析方法,利用 Python 3.8 中的 scikit-learn 机器学习库来实现机器学习算法,通过多种统计分析方法,如卡方检验、Fisher 精确检验、Shapiro-Wilk 检验等,来确定不同变量之间的差异,进而筛选出对预测模型有重要影响的变量 。

下面来看看具体的研究结果:

  • 临床特征和血细胞指标差异:研究总共纳入了 758 名患者,其中 534 人被诊断为良性肿瘤,224 人被诊断为恶性肿瘤。研究发现,良性肿瘤患者的年龄明显比恶性肿瘤患者小,而且良性肿瘤患者的病程时间更长。从身体状况来看,良性肿瘤患者整体状态更好。恶性肿瘤通过超声、CT 或 MR 检测出的肿瘤大小,明显大于良性肿瘤。同时,恶性肿瘤患者绝经后的比例以及出现腹水的比例,都比良性肿瘤患者高。在常见的生物标志物方面,恶性肿瘤患者的 CA125 浓度是良性肿瘤患者的 15 倍,HE4 浓度是 6 倍,ROMA 指数在良恶性肿瘤患者之间也存在显著差异。血常规指标中,恶性肿瘤患者的红细胞分布宽度(RDW)、白细胞计数(WBC)、中性粒细胞计数(NE)及百分比(NE%)、单核细胞数(MO)及百分比(MO%)、血小板数(PLT)等指标值比良性肿瘤患者高;而红细胞计数(RBC)、血红蛋白浓度(HGB)、血细胞比容(HCT)等指标值则更低。不过,嗜碱性粒细胞计数(BA)及百分比(BA%)在两类患者之间没有明显差异。由此可见,年龄、病程、患者身体状况、绝经状态、腹水、肿瘤大小、HE4、CA125、ROMA 指数以及多数血常规指标,都是区分卵巢肿瘤良恶性的重要临床变量。
  • 单因素逻辑回归分析:研究人员通过单因素逻辑回归进行初步判断,发现 BMI、肿瘤位置、BA、BA%、EO 和 MCV 这些指标,对卵巢癌的良恶性结果没有影响,所以在后续构建模型时将它们排除了。
  • 预测卵巢癌良恶性的决策树模型:经过数据处理,研究人员发现 ROMA_after 是决策树模型中信息增益最大的根节点。在这个模型里,还涉及到肿块大小(MR/CT)、LY%、CA125 等众多指标。其中 ROMA_after 对模型的重要性最高,其他指标也各有贡献。通过曲线下面积(AUC)评估模型的预测能力,结果显示该决策树模型的 AUC 为 0.86,经过 1000 次自采样内部验证后的平均 AUC 达到 0.899 。相比之下,仅依靠影像学指标或卵巢肿瘤生物标志物(如 CA125、HE4、ROMA)预测卵巢癌良恶性的模型,AUC 只有 0.74。这表明引入术前循环血细胞指标构建的决策树模型,预测价值更高。

从研究结论和讨论部分可以看出,早期检测卵巢肿瘤的良恶性,对改善患者预后意义重大。研究人员成功构建的这个基于术前常规血液指标和血清肿瘤标志物的决策树模型,有着独特的优势。ROMA_after 在模型中至关重要,同时血常规指标里的 LY%、HCT、PLT 等也发挥了重要作用。这个模型综合了影像学、肿瘤血清标志物和血常规相关指标,有望提升基层医院对卵巢癌的诊断能力。

不过,这个模型也存在一些局限性。比如它并不适用于所有卵巢肿瘤患者,研究排除了患有严重心脏病、肝肾疾病等的患者;一些已知的卵巢癌风险因素,像家族史、激素替代疗法等没有被纳入研究;肿瘤的病理亚型没有进一步分级;也没有充分考虑患者合并症、用药等混杂因素;特征选择过程可能会排除一些相关指标,影响模型的性能和适用性 。

但研究人员已经有了后续计划。他们打算通过多中心合作收集更多数据,利用现有公共数据集和数据共享平台,招募更多不同群体的患者,运用数据增强技术来扩大数据集。还会定期更新数据、重新训练模型,纳入更多新兴临床标志物、遗传信息等,进一步优化模型。同时,开展前瞻性研究,在不同人群中进行外部验证,让模型更准确、更具通用性。

这项研究虽然有不足,但它为卵巢癌的诊断开辟了新方向。随着研究的不断深入和模型的持续优化,这个决策树模型很可能在未来的临床诊断中发挥关键作用,帮助医生更准确地判断卵巢癌的良恶性,为患者争取更多的治疗时间和更好的治疗效果,成为女性健康的 “新卫士”。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号