ADNEX-AI:基于超声图像自动提取预测因子的可解释卵巢癌风险分层模型
《npj Precision Oncology》:ADNEX-AI: automated extraction of ultrasound predictors for interpretable ovarian cancer risk stratification
【字体:
大
中
小
】
时间:2025年12月12日
来源:npj Precision Oncology 8
编辑推荐:
本研究针对卵巢癌术前精准分诊的临床需求,开发了ADNEX-AI深度学习系统,可自动分割超声图像中的关键特征并整合至ADNEX风险模型。前瞻性多中心验证显示,其鉴别卵巢肿瘤良恶性的AUC达0.930,虽略低于医师手动测量的ADNEX模型(0.945),但校准更优、中心间变异更小。该研究为推广标准化卵巢癌风险分层提供了自动化解决方案。
卵巢癌是全球女性第八大常见癌症,也是致死率最高的妇科恶性肿瘤。在发达国家,卵巢癌的五年生存率仅为30%至50%,这主要是由于约三分之二的患者在确诊时已处于晚期。超声检查因其易得性、安全性和低成本,被国际指南推荐为评估附件包块的首选影像学方法。然而,卵巢肿瘤的良恶性鉴别诊断高度依赖于超声医师的经验水平,不同医师之间的诊断一致性存在较大差异。
为了解决这一问题,国际卵巢肿瘤分析(IOTA)小组开发了ADNEX模型,这是一个经过广泛验证的风险预测工具,能够对卵巢肿瘤进行精确的风险分层,并已被整合进超声报告系统和部分厂商的超声设备中。尽管ADNEX模型性能卓越,但其应用仍依赖于超声医师手动测量肿瘤的关键特征,如病灶最大直径、固体组织比例等。这种手动测量过程不仅耗时,还可能引入操作者间变异,限制了该模型在缺乏超声专家的医疗机构中的推广应用。深度学习技术的发展为自动化识别ADNEX模型所需的超声特征提供了新的机遇。将自动化特征提取与成熟的ADNEX统计模型相结合,有望提高工作流程效率,并降低对操作者经验的依赖。
在此背景下,由Axel Geysels和Giulia Garofalo作为共同第一作者,Dirk Timmerman和Ben Van Calster作为共同最后作者领导的研究团队,在《npj Precision Oncology》上发表了题为“ADNEX-AI: automated extraction of ultrasound predictors for interpretable ovarian cancer risk stratification”的研究论文。该研究开发并前瞻性验证了ADNEX-AI系统,这是一个能够从超声图像中自动分割关键形态学特征,并进而计算ADNEX风险预测因子的深度学习模型。
为开展此项研究,研究人员主要应用了以下几项关键技术:研究基于IOTA7-AI前瞻性多中心队列(11个中心,1457名患者),使用GE超声设备采集原始(RAW)图像数据以避免图像质量损失和标注偏倚;由经验丰富的超声专家手动勾画超声图像中的病灶、囊腔、固体组织和乳头状突起,作为模型训练的金标准;采用基于nnU-Net框架的多任务卷积神经网络进行图像分割,并添加辅助头来预测固体组织比例和乳头状突起数量;利用5折交叉验证开发模型,并在时间上独立的验证队列中进行评估;将自动提取的预测因子输入至已建立的ADNEX统计模型中进行风险计算;使用受试者工作特征曲线下面积(AUC)、校准曲线、决策曲线分析(DCA)和SHapley Additive exPlanations(SHAP)等方法全面评估模型性能。
研究最终纳入了来自11个中心的1457名患者的8824张图像。开发集包含369名患者(816张图像,43%为恶性),验证集包含1088名患者(8008张图像,35%为恶性)。患者基线特征与原始ADNEX开发数据集相似,但约有40%的患者缺少CA-125测量值,研究采用多重插补法处理缺失数据。
ADNEX-AI分割模型在开发集上表现出良好的分割性能。图像水平的Dice相似系数(DSC)中位数分别为:病灶93.6%、囊腔88.3%、固体组织75.8%、乳头状突起100%(后者因多数图像中不存在该结构而呈现完美中位数)。与超声检查者手动测量的变量相比,自动提取的四个ADNEX预测因子在患者水平上显示出更低的变异性(标准差)。
在包含CA-125的情况下,ADNEX-AI在验证集上区分良恶性肿瘤的AUC为0.930(95% CI 0.913-0.943),略低于检查者驱动的传统ADNEX模型(AUC 0.945, P=0.004)。在不包含CA-125时,ADNEX-AI的AUC为0.914,传统ADNEX为0.937(P<0.001)。值得注意的是,基于专家勾画结果直接输入ADNEX模型的性能基准(AUC 0.928)与ADNEX-AI非常接近,表明自动分割已接近专家水平。在不同肿瘤亚型(如良性 vs 交界性)的区分上,传统ADNEX通常表现更优,但ADNEX-AI在区分交界性肿瘤与I期肿瘤方面略有优势。关键的是,ADNEX-AI在不同中心间的判别性能异质性显著低于传统ADNEX(τ2 = 0.119 vs 0.412),表明自动化测量有助于实现更标准化的风险评估。
校准分析显示,无论是否包含CA-125,ADNEX-AI提供的风险估计都比传统ADNEX模型校准得更好。其观测值与期望值之比(O:E ratio)更接近1(含CA-125时:1.10 vs 1.23)。不过,校准的异质性在不同中心间,ADNEX-AI略高于传统ADNEX。
决策曲线分析表明,在整个临床相关的风险阈值范围内(0-0.5),ADNEX-AI与传统ADNEX的临床净获益差异极小,两者均优于“全部治疗”或“全部不治疗”的策略。SHAP可解释性分析显示,固体组织比例(包括线性和二次项)是对模型预测贡献最大的变量,其次是声影,其他变量影响中等,CA-125的贡献则相对 modest但稳定。这表明ADNEX-AI继承了原ADNEX模型的可解释性优势。
该研究的结论是,ADNEX-AI成功实现了从超声图像中自动提取ADNEX模型关键预测因子的目标,并在大规模前瞻性多中心队列中得到了验证。虽然其判别能力与经验丰富的超声医师手动应用ADNEX模型相比尚有微小差距,但其优势在于更好的校准特性、更低的中心间变异以及完全自动化的工作流程。通过将“黑箱”式的深度学习分割与透明、可解释的ADNEX统计模型相结合,ADNEX-AI在保持模型可解释性的同时,减少了对手动、操作者依赖性测量的依赖。这项研究标志着向标准化、可推广的卵巢癌风险分层迈出了重要一步,特别是对于缺乏专业超声专家的医疗机构具有重要价值。未来研究需要在其他超声设备厂商的图像上验证其普适性,并探索整合三维超声或动态视频剪辑以评估更多特征,从而进一步优化模型性能。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号