编辑推荐:
未破裂颅内动脉瘤(UICA)检测和分割存在挑战。研究人员基于 nnU-Net 开发 AI 模型,对比不同数据集训练的模型。结果显示该模型灵敏度高、假阳性率低,分割准确性与人类读者相当,有助于提升 UICA 临床诊断和监测水平。
在医学影像领域,未破裂颅内动脉瘤(Unruptured Intracranial Aneurysms,UICA)的检测与评估一直是备受关注的难题。UICA 就像隐藏在大脑血管中的 “定时炸弹”,悄无声息地威胁着人们的健康。它在人群中的患病率约为 3%,一旦破裂引发蛛网膜下腔出血,会导致极高的致残率和死亡率。目前,3D TOF-MRI(三维时间飞跃磁共振血管成像)是评估 UICA 的常用手段,因其具有无创、无辐射且无需造影剂等优点。然而,在实际临床应用中,通过 3D TOF-MRI 检测和分割微小的 UICA 却困难重重,放射科医生检测的灵敏度仅在 60 - 85% 之间,而且还缺乏对常规成像中人为误差率的全面研究。
随着人工智能(Artificial Intelligence,AI)技术的飞速发展,其在医学领域展现出巨大的潜力,为解决 UICA 检测和分割难题带来了新的希望。在此背景下,来自瑞士巴塞尔大学医院(University Hospital Basel)等机构的研究人员开展了一项旨在开发基于 nnU-Net 的开源 AI 模型的研究,用于在 3D TOF-MRI 中联合检测和分割 UICA,并对比在含有动脉瘤样鉴别诊断数据集上训练的模型性能。该研究成果发表在《Journal of Imaging Informatics in Medicine》上,为 UICA 的临床诊断和监测开辟了新的道路。
研究人员在开展此项研究时,运用了多种关键技术方法。首先是数据采集,他们进行了一项回顾性诊断成像研究,收集了 345 名患者在 2020 - 2023 年间的 385 张 3D TOF-MRI 图像(机构数据),还纳入了 ADAM 挑战的数据集。其次是数据处理,将训练数据分类为三个不同数据集,对数据进行分割标注。最后利用 nnU-Net 框架进行模型训练和评估,使用特定指标评估模型性能,并通过多种统计方法进行数据分析。
研究结果
- 数据概况:机构数据中的 UICA 大多为囊状,数据集还涵盖多种非血管病变。研究包含四个数据集,各数据集在动脉瘤直径、体积等方面存在差异12。
- AP + DD + ADAM 模型性能:该主要模型检测 UICA 的灵敏度为 0.85,假阳性(False Positive,FP)/ 病例率为 0.23 。正确检测的 UICA 的 DICE 评分达 0.73,归一化表面距离(Normalized Surface Distance,NSD)为 0.84 。阈值处理可降低 FP / 病例率,同时保持较高灵敏度34。
- 与其他模型比较:AP + DD + ADAM 模型在检测灵敏度上显著优于 ADAM 挑战获胜模型和仅在 ADAM 数据集上训练的 nnU-Net 模型 。在分割性能方面,与 ADAM 挑战获胜模型无显著差异,但优于 ADAM-nnU-Net 模型56。
- 不同模型检测性能:不同模型的整体灵敏度在 0.82 - 0.85 之间,FP / 病例率在 0.20 - 0.31 之间,无显著差异。模型能识别出临床报告中未描述的动脉瘤,且灵敏度随病变直径增加而提高,FP / 病例率则降低78。
- 分割性能与人的比较:模型的平均 DICE 评分和 NSD 与人类读者无显著差异,表明模型达到人类水平的分割性能。但模型预测的病变体积比实际偏小910。
研究结论与讨论
该研究成功开发出基于 nnU-Net 的开源 AI 模型,在 3D TOF-MRI 检测和分割 UICA 方面表现出色。其 85% 的灵敏度和 0.23 的低 FP / 病例率,以及与人类读者相当的分割性能(DICE 评分 0.73,NSD 为 0.84),意味着该模型有望改善常规临床环境中 UICA 的检测,辅助长期监测动脉瘤大小变化。
不过,研究也存在一定局限性,如缺乏在其他中心的前瞻性评估,未直接对比与放射科医生的检测性能。未来需在更能反映普通人群 UICA 发病率的数据集上验证模型性能。但这一研究成果仍为 UICA 的诊断和治疗提供了重要的参考依据,为后续研究和临床应用奠定了坚实基础,推动了医学影像领域在 UICA 诊断方面的进步。