深度学习助力前列腺 MRI 质量评估:减少不必要重扫的新利器

【字体: 时间:2025年04月30日 来源:European Radiology Experimental 3.8

编辑推荐:

  当前前列腺 MRI 的 T2 加权成像(T2WI)受多种因素影响导致图像质量参差不齐,影响癌症检测。研究人员开展了深度学习(DL)评估 T2WI 前列腺 MRI 图像质量的研究。结果显示 DL 模型评估准确率超 75%,能减少不必要重扫,对优化检查时间管理意义重大。

  在医学影像学领域,前列腺癌的检测一直是重点关注的问题。多参数磁共振成像(mpMRI)作为当前检测前列腺癌的标准成像方法,其中 T2 加权成像(T2WI)是关键组成部分。然而,实际临床中,T2WI 图像质量却常常受到多种因素的干扰。比如患者检查时的身体运动,或者体内存在的金属植入物,这些都可能导致图像出现伪影、模糊等问题,进而严重影响前列腺癌的检测准确率。而且,即使遵循相关成像指南,也无法完全保证图像质量。以往,对于图像质量的评估主要依赖放射科医生的主观判断,这不仅耗费时间和精力,还容易受到医生经验和疲劳等因素的影响。因此,开发一种能够自动、准确评估 T2WI 图像质量的方法迫在眉睫。
为了解决这一难题,来自美国梅奥诊所(Mayo Clinic)和日本京都大学的研究人员展开了深入研究。他们的研究成果发表在《European Radiology Experimental》上,为前列腺 MRI 图像质量评估带来了新的希望。

研究人员采用了深度学习(DL)技术,这是一种强大的人工智能算法,能够从大量数据中学习模式和特征。研究数据来自 2017 - 2021 年三个地点的临床前列腺 MRI 检查,最初有 27473 例检查,经过筛选,排除了 Gleason 评分(GS)≥7 的患者检查数据,最终得到 15518 例数据,再进一步选取 1412 例用于研究。

在研究过程中,研究人员先让四位经验丰富的泌尿放射科医生对 T2WI 扫描图像进行质量评分,评分采用 0 - 3 分的四级量表,0 分表示无法解读,1 分表示勉强可解读,2 分表示诊断充分,3 分表示诊断绰绰有余 。之后,这些评分被进一步分为两类,即非诊断性(IQ 为 0 或 1)和诊断性(IQ 为 2 或 3),前者意味着需要重新扫描,后者则不需要。

接着,研究人员构建了 DL 模型。他们考虑了 11 种三维卷积神经网络架构,最终选择了 3DDenseNet_169 模型。在训练模型前,为了提高模型性能并减少内存占用,研究人员进行了一系列预处理操作。比如,只选取每个检查的 16 个中心轴向切片,利用内部分割模型围绕前列腺进行紧密裁剪,再通过 Lanczos 插值法将图像统一采样为 256×256 像素,最后对像素值进行标准化处理。此外,由于数据集中无法解读(IQ = 0)的检查数量较少,研究人员采用了自采样方法对这部分数据进行过采样,以平衡各类数据的比例。

模型训练完成后,研究人员对其进行了多方面评估。他们计算了模型对 IQ 评分和重扫决策的准确率、精度、召回率、F1 分数以及索引平衡准确率等指标。同时,通过五折交叉验证来评估模型的一致性。

研究结果令人振奋。在专家放射科医生评分统计方面,1412 例检查的评分分布为:IQ = 0 的有 119 例(8.4%);IQ = 1 的有 341 例(24.1%);IQ = 2 的有 578 例(40.9%);IQ = 3 的有 374 例(26.4%) 。阅片者之间的一致性良好,Cohen κ 值为 0.738 ± 0.043,Krippendorf α 值为 0.73。

DL 模型的表现也十分出色。在测试集中,模型预测 IQ 评分的准确率达到 57.1%,Cohen κ 值为 0.658,表明模型与专家评分有较高的一致性。对于重扫决策,模型的准确率为 78.3%,Cohen κ 值为 0.537,F1 分数为 0.79。这意味着模型能够较好地区分非诊断性和诊断性扫描。而且,经过五折交叉验证,虽然过采样和紧密裁剪略微降低了模型的平均性能,但总体表现依然稳定。

与临床实际操作相比,研究人员以 Site III 的 174 例检查为例进行分析。在这些检查中,技术人员评估的结果与放射科医生的判断存在一定差异。而 DL 模型的应用,理论上可以将不必要的重扫率从 63% 降低到 28%,同时保持 86% 的敏感度,这大大减少了不必要的扫描时间。

在研究结论和讨论部分,研究人员指出,他们成功开发了用于评估 T2WI 前列腺 MRI 图像质量的 DL 模型。该模型能够准确区分诊断性和非诊断性图像,准确率达到 78.3%,受试者工作特征曲线下面积(AUC)为 0.867。这一成果对于优化 MR 扫描仪的使用时间、减少不必要的重扫具有重要意义。例如,如果一台扫描仪每天进行 10 例前列腺 MRI 检查,使用该模型每天可减少 2 次不必要的重扫,节省 10 分钟以上的梯度时间。

不过,研究也存在一些局限性。比如,数据集中最低质量(IQ = 0)的检查比例仍然较低,尽管采取了过采样等方法,但理想情况下应增加更多真正的低质量扫描数据。而且,这些数据集均采集于 2017 - 2021 年,很多数据在 PI - RADS v2.1 发布之前,因此基于更新的数据集重新调整模型会更合适。此外,只有 203 例检查由多个放射科医生评估,更多的同时评分会使阅片一致性评估更准确。研究设计为回顾性研究,未来开展前瞻性研究将更具临床指导意义。

尽管存在这些不足,但这项研究依然为前列腺 MRI 图像质量评估提供了新的思路和方法。DL 技术在医学影像学领域的应用潜力巨大,有望在未来进一步优化和完善,为临床诊断和治疗提供更有力的支持。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号