多模态不确定性感知AI系统优化卵巢癌风险评估临床工作流:UMORSS的前瞻性验证与临床转化
《npj Digital Medicine》:A multimodal uncertainty-aware AI system optimizes ovarian cancer risk assessment workflow
【字体:
大
中
小
】
时间:2025年10月17日
来源:npj Digital Medicine 15.1
编辑推荐:
本研究针对卵巢癌筛查中存在的诊断延迟与临床决策变异问题,开发了UMORSS(Uncertainty-aware Multimodal Ovarian Risk Scoring System)系统。该系统通过整合超声影像与临床数据,结合不确定性量化(UQ)技术,实现两阶段风险评估:第一阶段快速识别低风险病变(生理性囊肿68.7%,良性肿瘤13.8%),第二阶段对复杂病例进行多模态分析。研究基于多中心数据集(7352例患者)验证显示,UMORSS在内部测试和外部验证中AUC分别达0.955和0.926,前瞻性读者研究(n=284)表明其辅助放射科医生将诊断AUC提升10.58%,灵敏度提高22.48%。该系统为卵巢癌标准化诊断提供了可解释的AI工具,显著优化临床资源分配。
卵巢癌是妇科恶性肿瘤中死亡率最高的疾病之一,其早期诊断困难、治疗延迟问题突出。目前临床依赖超声影像、临床病史和实验室检查等多模态数据进行风险评估,但存在高度依赖医师经验、诊断标准不统一等挑战。国际通用的卵巢附件报告与数据系统(O-RADS)虽提供了标准化框架,但手动评估仍存在主观差异。近年来,人工智能在医学影像分析中展现出潜力,然而“黑箱”特性与多模态数据融合的不确定性限制了其临床转化。
为解决这一难题,西安电子科技大学与西京医院团队在《npj Digital Medicine》发表了题为“A multimodal uncertainty-aware AI system optimizes ovarian cancer risk assessment workflow”的研究,开发了UMORSS系统。该系统通过两阶段框架模拟临床路径:第一阶段基于超声图像快速筛查低风险病变,第二阶段整合多模态数据与不确定性量化技术对复杂病例进行精细分类。研究利用来自4个中心的7352例患者数据(含9281张超声图像)进行训练与验证,并通过前瞻性读者研究评估临床实用性。
关键技术方法包括:基于视觉注意力网络(VAN)的超声图像特征提取、XGBoost多模态数据融合、基于预测损失回归的不确定性量化模块,以及不确定性加权的人机协作策略。样本队列来源于西京医院(2012-2021年)及其他三家医院(2020-2021年)的回顾性数据,前瞻性队列纳入2022年西京医院284例患者。
Phase I通过联合约束风险预测与不确定性评分(阈值分别为0.65和0.62),在三个测试队列中成功识别68.7%的生理性囊肿和13.8%的良性肿瘤为低风险病例,且无一例假阴性(False Negative, FN)。这一阶段显著减少了不必要的进一步检查,符合临床“敏感性优先”原则。
不确定性分析显示,交界性肿瘤(Borderline Tumours)的不确定性评分最高,与临床诊断难点一致(图3a)。在内部测试队列中,UMORSS(整合临床参数后)的AUC达0.947(95% CI: 0.928–0.964),较纯图像模型显著提升(P<0.001)。进一步应用不确定性过滤(High Reliability UMORSS)后,F1分数提高至0.849,马修斯相关系数(MCC)达0.825(图3b,c)。外部多中心验证结果一致,表明模型具有良好的泛化能力。
在前瞻性队列中,UMORSS独立诊断的AUC为0.984,灵敏度达0.954。其性能优于多数放射科医生,尤其在高可靠性模式下(AUC: 0.991)超越所有参与医师的单项指标(图4)。
通过不确定性加权融合方案(公式3),AI辅助使放射科医生的平均AUC提升10.58%,灵敏度提高22.48%,且特异性保持稳定(图5)。对经验较少的医生(Reader 6)改善尤为显著,灵敏度提升4.57倍。
SHAP(SHapley Additive exPlanations)分析与SHAP加权类激活图(Class Activation Maps, CAM)显示,模型关注区域与恶性肿瘤超声特征(如实性成分、乳头状突起)高度吻合(图6),证实其决策符合临床逻辑。
UMORSS通过两阶段设计、多模态融合及不确定性量化,实现了卵巢癌风险评估的精准化与标准化。其核心价值在于:
- 1.临床工作流优化:Phase I安全排除低风险病变,Phase II通过UQ标识疑难病例,减少资源浪费;
- 2.诊断一致性提升:人机协作方案显著降低不同经验医师的诊断差异;
- 3.技术普适性:模块化UQ设计可扩展至其他医学影像任务。
未来需通过多中心前瞻性试验验证实时工作流整合效果,并探索动态超声视频数据的融合。该研究为高风险医疗决策中AI系统的可靠嵌入提供了范式。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号