深度学习在MRCP图像中区分良性和恶性胆管扩张的应用：Xception-逻辑回归集成模型的开发与前瞻性评估

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《JOURNAL OF MAGNETIC RESONANCE IMAGING》：Deep Learning for Differentiating Benign From Malignant Bile Duct Dilation on MRCP: Development and Prospective Evaluation of an Xception-Logistic Regression Ensemble Model

【字体：大中小】 时间：2025年12月10日 来源：JOURNAL OF MAGNETIC RESONANCE IMAGING 3.5

编辑推荐：

　　准确鉴别胆管扩张良恶性需客观评估方法，本研究构建并验证基于3T MRCP图像的深度学习（Xception模型及集成策略）自动诊断系统，回顾性纳入378例，前瞻性60例，结果显示集成模型AUC达0.89，诊断准确率90%，与放射科医生水平相当。

摘要

背景

准确识别良性和恶性胆管扩张（BDD）对于制定治疗计划至关重要。传统的影像学评估方法具有主观性，而深度学习（DL）则提供了自动化客观评估的潜力。

目的

基于磁共振胰胆管造影（MRCP）图像，构建并评估用于识别良性和恶性BDD的DL模型及其集成策略。

研究类型

回顾性和前瞻性研究。

研究对象

研究纳入了来自两家机构的回顾性队列（n = 378例；中位年龄60岁 [范围：14–90岁]；其中194名为男性）以及前瞻性队列（n = 60例；中位年龄62.5岁 [范围：15–86岁]；其中30名为男性）。回顾性数据被随机分为训练集、验证集和内部测试集（比例为2:1:1），以及一个独立的外部测试集。为了平衡类别分布，对良性病例进行了降采样处理。

磁场强度/序列

3T MRCP（3D涡轮自旋回波：VISTA和SPACE）。

评估方法

主要的回顾性评估指标是DL算法及其集成模型的曲线下面积（AUC）。前瞻性研究中，将模型的准确性、敏感性和特异性与三位放射科医生的结果进行了比较。

统计方法

组间比较使用了Mann–Whitney U检验和卡方检验（p < 0.05）。模型性能评估采用了Hosmer–Lemeshow检验、带Bonferroni校正的DeLong检验（α = 0.005）以及McNemar检验。

结果

Xception模型在内部测试集上的AUC为0.816（95%置信区间：0.788–0.844），在外部测试集上的AUC为0.807（95%置信区间：0.779–0.835）。结合逻辑回归的集成模型在患者层面的AUC分别为0.890和0.885，校准效果良好（p = 0.109）。五种集成策略之间未观察到显著差异（最小调整后的p = 0.62）。在前瞻性队列中，该模型的准确率、敏感性和特异性均为90.0%，与放射科医生的结果相当（分别为76.7%–86.7%），且无显著差异（p = 0.143、0.302和0.774）。

数据结论

Xce-LR模型显示出利用MRCP自动化区分良性和恶性胆管扩张的潜力。

证据水平

2级。

技术有效性

2阶段。

利益冲突

作者声明没有利益冲突。

数据可用性声明

所有患者数据均按照机构和伦理规定进行了完全匿名处理。由于机构审查委员会（IRB）的限制，本研究生成和分析的数据集无法公开，但经第一作者同意可提供相关访问。深度学习模型的实现依赖于内部基础设施的专有代码，因此也无法公开。然而，我们的工作基于标准的Xception架构，仅进行了超参数调整。该模型的公开PyTorch实现可在https://github.com/Cadene/pretrained-models.pytorch获取。使用标准库（Python v3.0.1，scikit-learn v0.22）进行复制所需的所有实验细节均在“方法”部分和“支持信息”中提供。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号