基于异常对齐的引导式语言-图像预训练模型Abn-BLIP在CTPA肺动脉栓塞诊断与报告生成中的应用

【字体: 时间:2025年09月05日 来源:Medical Image Analysis 11.8

编辑推荐:

  针对CTPA(计算机断层扫描肺动脉造影)影像解读复杂、报告生成效率低的问题,研究者开发了异常对齐的引导式语言-图像预训练模型Abn-BLIP,通过多标签异常识别模块和Abn-QFormer跨模态注意力机制,显著提升肺动脉栓塞诊断准确性和结构化报告生成质量,为临床决策提供高效支持。

  

研究背景与意义

肺动脉栓塞(PE)是一种致死率高的危急重症,计算机断层扫描肺动脉造影(CTPA)是其诊断金标准。然而,CTPA影像解读高度依赖放射科医师经验,存在耗时长、主观性强、漏诊率高等问题。现有AI辅助诊断系统多局限于单一栓塞检测,缺乏对心肺系统多异常的综合评估能力,且生成的报告可解释性不足。如何实现精准的异常定位并生成符合临床规范的结构化报告,成为医学影像AI领域的关键挑战。

研究方法与技术路线

布朗大学团队提出Abnormality-aligned Bootstrapping Language-Image Pre-training(Abn-BLIP)框架,基于来自美国两家医疗中心的79,002例CTPA影像-报告对开展研究。核心技术包括:

  1. 1.

    多尺度异常识别:采用I3D ResNet152提取32种CTPA异常特征,通过3D卷积块生成多层级视觉嵌入;

  2. 2.

    异常驱动查询转换器(Abn-QFormer):32个可学习查询向量动态捕获异常特异性特征,结合BERT文本编码器实现跨模态对齐;

  3. 3.

    异常对齐对比学习(ACL):优化视觉-文本特征空间相似性,增强细粒度语义匹配。

研究结果

  1. 1.

    异常诊断性能

    在联合测试集上达到0.896准确率和0.773 AUC,对肺动脉区域异常(如急性肺栓塞)的检测灵敏度达0.958,特异性0.789。

  2. 2.

    跨模态特征分析

    t-SNE可视化显示,肺动脉相关异常(如"急性肺栓塞"与"慢性肺栓塞")在特征空间形成明确聚类,与解剖学关系一致。

  3. 3.

    报告生成质量

    在INSPECT数据集上,ROUGE-L达0.588,BERTScore F1为0.937,显著优于RadFM等基线模型。专家评估显示83%生成报告获4分以上(5分制)。

  4. 4.

    临床实用性验证

    对比真实病例显示,Abn-BLIP能准确描述双侧肺动脉充盈缺损(敏感性0.710)等关键征象,而传统方法常漏诊支气管扩张等合并症。

结论与展望

该研究通过异常导向的视觉-语言对齐机制,首次实现了CTPA全胸结构化报告的端到端生成。模型在《Medical Image Analysis》发表的性能测试中展现出三大优势:

  1. 1.

    诊断覆盖性:同步检测7个解剖区域的32种异常;

  2. 2.

    临床可解释性:通过Abn-QFormer提供异常级别的视觉依据;

  3. 3.

    工作流兼容性:平均1分钟/例的处理速度适合临床场景。

    未来需在罕见病识别、多中心验证等方面持续优化,但其模块化设计为不同医疗机构的定制化部署提供了可能。这项技术有望成为放射科医师的"AI第二双眼",显著提升肺栓塞诊疗效率与质量。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号