基于解剖学启发式后处理的深度学习颅内动脉瘤检测模型:显著降低假阳性并提升可解释性

《Scientific Reports》:Automated, anatomy-based, heuristic post-processing reduces false positives and improves interpretability of deep learning intracranial aneurysm detection models

【字体: 时间:2025年12月23日 来源:Scientific Reports 3.9

编辑推荐:

  为解决深度学习(DL)模型在CTA颅内动脉瘤检测中假阳性(FP)率高、阻碍临床转化的问题,研究人员开展了一项关于自动化、基于解剖学的启发式后处理策略的研究。该研究将DL模型与自动化的脑组织掩膜及动静脉分离模块相结合,构建了混合启发式-DL管道。结果表明,该方法在保留高灵敏度的同时,显著降低了假阳性率(FPR),在私有和公开数据集上均验证了其有效性。该策略不仅提升了模型性能,还通过引入可解释的解剖学规则,增强了临床医生对AI预测的信任,为放射学领域AI的临床转化提供了新范式。

  
颅内动脉瘤是脑动脉壁上的异常膨出,其破裂导致的蛛网膜下腔出血具有高达40-50%的30天死亡率。因此,早期、准确地检测颅内动脉瘤至关重要。目前,计算机断层扫描血管成像(CTA)是筛查和诊断颅内动脉瘤的主要无创影像学方法。然而,放射科医生需要从每例CTA扫描的数百张图像中寻找毫米级的动脉瘤,这个过程不仅耗时耗力,而且容易因视觉疲劳导致漏诊。
近年来,深度学习(Deep Learning, DL)技术被广泛应用于辅助动脉瘤检测,并展现出超过90%的灵敏度。然而,这些模型普遍存在一个致命的缺陷:过高的假阳性(False Positive, FP)率。这意味着模型会频繁地将正常的血管结构、静脉或颅外组织误判为动脉瘤。这种“狼来了”的效应不仅会浪费医生的宝贵时间,导致“警报疲劳”,还会降低医生对AI工具的信任度,从而严重阻碍了这些先进模型在临床中的实际应用。
为了解决这一关键瓶颈,来自哈佛医学院和东北大学的研究团队另辟蹊径,提出了一种全新的策略。他们不再局限于在深度学习模型内部进行复杂的参数调整,而是将目光投向了模型之外,利用人类专家的解剖学知识来“修正”模型的错误。该团队开发了一种全自动的、基于解剖学的启发式后处理方法,并将其与现有的深度学习模型无缝集成,构建了混合启发式-DL管道。这项旨在显著降低假阳性、同时保持高灵敏度的研究成果,于2025年12月22日在线发表于《Scientific Reports》杂志。
为了开展这项研究,研究人员构建了一个全自动的混合管道,该管道将核心的DL动脉瘤检测模型与基于解剖学知识的启发式后处理模块相结合。研究采用了两种架构迥异的DL模型(CPM-Net和3D-CNN-TR)来验证方法的普适性。关键的后处理模块包括:利用开源工具生成脑组织掩膜以去除颅外背景;开发并应用了一种新型的DL动静脉分离算法,从无标签的CTA数据中自动生成动脉、静脉和海绵窦(Cavernous Venous Sinus, CVS)分割掩膜。研究人员设计了5种不同的后处理策略,通过判断检测框与这些解剖掩膜的重叠关系来过滤假阳性。研究在包含143例私有数据和843例公开RSNA数据的两个独立测试集上进行了评估,以验证方法的有效性和泛化能力。
研究结果
DL模型基线性能与假阳性分布分析
在私有测试集上,CPM-Net和3D-CNN-TR模型分别检测出126个和182个假阳性,假阳性率(FPR)分别为0.88和1.27。对假阳性来源的深入分析揭示了两个模型不同的错误模式:CPM-Net的假阳性主要来源于静脉结构(56.3%),而3D-CNN-TR的假阳性则更多来自动脉结构(53.3%)。此外,两个模型均有相当比例的假阳性位于颅外(CPM-Net为27.3%,3D-CNN-TR为42.3%)。这些发现为后续的启发式后处理策略提供了明确的目标。
后处理方法的性能评估
研究人员测试了5种不同的后处理方法。其中,方法5(结合脑组织掩膜和“动脉重叠多于静脉重叠”的规则)在私有数据集上表现最佳,在不损失任何真阳性(True Positive, TP)的情况下,将CPM-Net和3D-CNN-TR的假阳性分别减少了70.6%和51.6%,假阳性率分别降至0.26和0.62。在公开的RSNA数据集上,方法1(仅使用增强脑组织掩膜)在保留灵敏度方面表现最好,仅移除了极少数真阳性,同时去除了31.4%和33.8%的假阳性。这些结果表明,基于解剖学的后处理策略能够有效、稳健地降低假阳性。
假阳性消除的解剖学机制
研究详细分析了不同后处理方法对各类假阳性的消除效果。脑组织掩膜(方法1)几乎完全消除了颅外假阳性。静脉掩膜(方法2)和“动脉多于静脉”的规则(方法3)则能有效去除静脉来源的假阳性,例如盖伦静脉(Vein of Galen)和静脉窦。值得注意的是,方法3在私有数据集上实现了对静脉假阳性的高效去除,且未损失任何真阳性,显示出其在处理动静脉毗邻区域时的优越性。
不同置信度阈值下的性能表现
通过绘制灵敏度与假阳性率曲线,研究人员发现,在低假阳性容忍度(0至0.5 FPR)下,方法5始终能提供更高的灵敏度。而在中高假阳性容忍度下,方法1在3D-CNN-TR模型上的表现优于方法5。这提示临床医生可以根据实际工作流中对假阳性的容忍度,灵活选择最合适的后处理策略。
研究结论与讨论
本研究成功设计、构建并验证了一种全自动的混合启发式-DL软件管道,该管道通过整合领域特定的、基于解剖学的后处理模块,显著降低了颅内动脉瘤检测的假阳性率,且对灵敏度的影响微乎其微。这一策略的核心优势在于其高度的可解释性:通过引入脑组织掩膜和动静脉分离等解剖学规则,医生可以清晰地理解模型为何会过滤掉某个检测结果,从而增强了对AI预测的信任。
该研究还揭示了当前DL模型在动脉瘤检测中的局限性。尽管后处理模块能有效去除颅外和静脉来源的假阳性,但对于动脉来源的假阳性(如血管分叉处、漏斗部等)处理效果有限。这提示未来的研究应致力于开发能够更精细区分正常动脉解剖与动脉瘤的算法。
此外,该管道设计具有高度的灵活性和通用性。它不依赖于特定的DL模型,可以轻松地整合未来更先进的检测模型,为放射学领域AI的持续改进和临床转化提供了一条可持续的路径。总之,这项研究为解决AI模型假阳性高、可解释性差这一临床转化核心瓶颈提供了切实可行的解决方案,是推动放射学AI迈向临床实践的重要一步。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号