基于CT影像组学的可解释机器学习模型精准鉴别子宫内膜良恶性肿瘤:一项双中心研究

《BioMedical Engineering OnLine》:CT radiomics-based explainable machine learning model for accurate differentiation of malignant and benign endometrial tumors: a two-center study

【字体: 时间:2025年11月05日 来源:BioMedical Engineering OnLine 3.2

编辑推荐:

  本研究针对子宫内膜癌(EC)术前精准诊断难题,开发了基于CT影像组学的可解释机器学习模型。研究人员通过提取1132个影像组学特征,采用六种机器学习算法构建诊断模型,结果显示随机森林模型表现最优(测试集AUROC达0.96)。该模型通过SHAP分析和特征图谱可视化增强可解释性,为EC无创诊断提供了智能化辅助工具,对临床决策支持具有重要意义。

  
在妇科肿瘤领域,子宫内膜癌(Endometrial Cancer, EC)已成为高收入国家最常见的妇科恶性肿瘤,其发病率和死亡率呈现持续上升趋势。据估计,仅2023年美国就有66,200例新发病例和13,030例相关死亡。尽管医学影像技术不断进步,但术前准确区分子宫内膜良恶性肿瘤仍面临巨大挑战,这直接影响到治疗策略的制定和患者预后。
目前,磁共振成像(MRI)因其优越的软组织分辨率在EC诊断中应用广泛,但计算机断层扫描(CT)因其快速成像和广泛普及性,仍是临床初始评估的首选检查方法。然而,传统CT影像诊断主要依赖医生的主观视觉评估,缺乏客观的定量分析指标,难以捕捉肿瘤内部的微观异质性特征。正是在这样的临床需求背景下,张廷锐等研究人员在《BioMedical Engineering OnLine》上发表了创新性研究,探索基于CT影像组学的机器学习方法在EC精准诊断中的应用价值。
本研究采用的关键技术方法包括:收集来自两个医疗中心的83例子宫内膜癌患者术前CT影像数据,手动勾画感兴趣区域(ROI)并提取1132个影像组学特征,采用六种机器学习算法(逻辑回归、K近邻、支持向量机、XGBoost、TabPFNv2和随机森林)构建分类模型,通过SHAP分析增强模型可解释性,并使用校准曲线和决策曲线评估临床实用性。
临床特征
研究纳入83例EC患者,其中恶性46例,良性37例。训练集59例(恶性33例,良性26例),测试集24例(恶性13例,良性11例)。两组患者在年龄、性别和诊断类型等基线特征上无显著差异(P=0.218-1),保证了后续分析的可比性。
影像组学特征发现
通过SHAP分析识别出前20个最重要的影像组学特征,其中60%为纹理特征,40%为一阶统计特征。值得注意的是,90%的特征来源于变换后的图像(如小波变换和LoG滤波),表明图像预处理能有效增强特征表达能力。表2显示,恶性与良性组间这20个特征均存在显著差异(P<0.001),如LoG-5-0-mm-firstorder_90Percentile在恶性组均值为0.90±2.77,而良性组为-0.97±0.72,证实这些特征具有显著鉴别能力。
影像组学特征图谱
图2通过特征图谱直观展示了良恶性肿瘤的视觉差异。恶性肿瘤(上图)表现出更强的异质性和复杂的内部模式,而良性肿瘤(下图)则呈现更均匀的强度分布和平滑过渡。这种可视化方法为理解复杂的数学特征提供了直观工具,增强了模型在临床应用中的可行性。
机器学习模型开发
如表3所示,六种机器学习模型中,随机森林表现最优,训练集AUROC达1.00,测试集AUROC为0.96,灵敏度100%,特异度92.31%。其他模型如XGBoost虽在训练集表现完美(AUROC=1.00),但测试集性能下降至0.88,存在过拟合现象。随机森林的集成学习特性使其能有效处理高维特征且抗过拟合能力强。
最终影像组学模型的整体性能
随机森林模型在测试集保持了高判别效能(AUROC=0.96,AUPRC=0.94)。校准曲线显示预测概率与实际结果高度一致,决策曲线分析表明在大多数阈值概率下,使用该模型的净获益高于"全处理"或"全不处理"策略,证实其临床实用性。
讨论与结论
本研究首次将CT影像组学与可解释机器学习相结合用于EC鉴别诊断,填补了该领域的研究空白。随机森林模型之所以表现优异,源于其集成学习机制能有效处理高维特征并减少过拟合风险。研究中识别的关键影像组学特征,如多尺度纹理特征和小波分解特征,与肿瘤异质性密切相关,可作为AI驱动的影像学生物标志物。
值得注意的是,研究通过SHAP分析和特征图谱可视化解决了AI模型"黑箱"问题,增强了临床可接受度。然而,研究也存在样本量有限、数据来源相对单一等局限性。未来需要多中心、大样本研究进一步验证模型的泛化能力。
该研究的创新点在于:首次系统比较了多种机器学习算法在CT影像组学中的应用;开发了高精度的EC鉴别诊断模型;通过可解释性技术增强了临床实用性。这一智能辅助工具有望在临床实践中帮助医生实现更早、更准确的EC诊断,优化治疗决策,最终改善患者预后。
研究证实,基于CT影像组学的机器学习模型能有效区分子宫内膜良恶性肿瘤,其中随机森林算法表现最佳。这种方法充分利用了临床广泛应用的CT检查,为EC的精准诊断提供了新途径,对推动个性化医疗发展具有重要意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号