深度学习在MRCP图像中区分良性和恶性胆管扩张的应用:Xception-逻辑回归集成模型的开发与前瞻性评估

《JOURNAL OF MAGNETIC RESONANCE IMAGING》:Deep Learning for Differentiating Benign From Malignant Bile Duct Dilation on MRCP: Development and Prospective Evaluation of an Xception-Logistic Regression Ensemble Model

【字体: 时间:2025年12月10日 来源:JOURNAL OF MAGNETIC RESONANCE IMAGING 3.5

编辑推荐:

  准确鉴别胆管扩张良恶性需客观评估方法,本研究构建并验证基于3T MRCP图像的深度学习(Xception模型及集成策略)自动诊断系统,回顾性纳入378例,前瞻性60例,结果显示集成模型AUC达0.89,诊断准确率90%,与放射科医生水平相当。

  

摘要

背景

准确识别良性和恶性胆管扩张(BDD)对于制定治疗计划至关重要。传统的影像学评估方法具有主观性,而深度学习(DL)则提供了自动化客观评估的潜力。

目的

基于磁共振胰胆管造影(MRCP)图像,构建并评估用于识别良性和恶性BDD的DL模型及其集成策略。

研究类型

回顾性和前瞻性研究。

研究对象

研究纳入了来自两家机构的回顾性队列(n = 378例;中位年龄60岁 [范围:14–90岁];其中194名为男性)以及前瞻性队列(n = 60例;中位年龄62.5岁 [范围:15–86岁];其中30名为男性)。回顾性数据被随机分为训练集、验证集和内部测试集(比例为2:1:1),以及一个独立的外部测试集。为了平衡类别分布,对良性病例进行了降采样处理。

磁场强度/序列

3T MRCP(3D涡轮自旋回波:VISTA和SPACE)。

评估方法

主要的回顾性评估指标是DL算法及其集成模型的曲线下面积(AUC)。前瞻性研究中,将模型的准确性、敏感性和特异性与三位放射科医生的结果进行了比较。

统计方法

组间比较使用了Mann–Whitney U检验和卡方检验(p < 0.05)。模型性能评估采用了Hosmer–Lemeshow检验、带Bonferroni校正的DeLong检验(α = 0.005)以及McNemar检验。

结果

Xception模型在内部测试集上的AUC为0.816(95%置信区间:0.788–0.844),在外部测试集上的AUC为0.807(95%置信区间:0.779–0.835)。结合逻辑回归的集成模型在患者层面的AUC分别为0.890和0.885,校准效果良好(p = 0.109)。五种集成策略之间未观察到显著差异(最小调整后的p = 0.62)。在前瞻性队列中,该模型的准确率、敏感性和特异性均为90.0%,与放射科医生的结果相当(分别为76.7%–86.7%),且无显著差异(p = 0.143、0.302和0.774)。

数据结论

Xce-LR模型显示出利用MRCP自动化区分良性和恶性胆管扩张的潜力。

证据水平

2级。

技术有效性

2阶段。

利益冲突

作者声明没有利益冲突。

数据可用性声明

所有患者数据均按照机构和伦理规定进行了完全匿名处理。由于机构审查委员会(IRB)的限制,本研究生成和分析的数据集无法公开,但经第一作者同意可提供相关访问。深度学习模型的实现依赖于内部基础设施的专有代码,因此也无法公开。然而,我们的工作基于标准的Xception架构,仅进行了超参数调整。该模型的公开PyTorch实现可在https://github.com/Cadene/pretrained-models.pytorch获取。使用标准库(Python v3.0.1,scikit-learn v0.22)进行复制所需的所有实验细节均在“方法”部分和“支持信息”中提供。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号