基于领域知识增强的视觉-语言对比表征学习框架KL-CVR在医学图像分析中的应用

【字体: 时间:2025年06月11日 来源:Computer Vision and Image Understanding 4.3

编辑推荐:

  医学视觉表征学习面临标注数据稀缺和跨模态对齐不充分等挑战。研究人员提出知识引导的对比视觉表征学习框架KL-CVR,通过构建医学知识图谱(KG)生成知识嵌入,并创新性地提出视觉对齐(VA)和语义匹配(SM)两种知识注入方法。实验表明该方法在CBIR和分类任务中性能优于CLIP,且所需训练数据量显著减少,为医学图像分析提供了新思路。

  

医学图像分析领域长期面临标注数据稀缺的困境。传统监督学习方法需要大量专家标注,而医疗数据涉及隐私且标注成本高昂。与此同时,基于对比学习的视觉-语言(VL)模型如CLIP虽能利用图像-文本对进行自监督学习,但在医学领域存在两大痛点:一是医学术语的语义复杂性导致文本嵌入质量不稳定,二是传统InfoNCE损失的二元对齐约束会忽略医学概念间的层次关系,造成潜在假阴性问题。这些限制使得现有方法难以捕捉医学图像中细微的病理特征和复杂的语义关联。

中国的研究团队针对这些问题提出了知识引导的对比视觉表征学习框架KL-CVR。该研究创新性地将统一医学语言系统(UMLS)的领域知识融入视觉表征学习过程,通过两个关键阶段实现突破:首先构建融合医学概念和图像节点的知识图谱,采用TransE算法生成知识嵌入;随后设计视觉对齐(VA)和语义匹配(SM)两种知识注入策略,前者通过多任务学习增强模型鲁棒性,后者利用连续伪标签缓解假阴性问题。研究在ROCOv2、MEDICAT等医学数据集上验证,结果显示KL-CVR在仅使用1/180训练数据量的情况下,性能接近当前最优的BioMedCLIP模型。相关成果发表在《Computer Vision and Image Understanding》期刊。

关键技术方法包括:1) 基于UMLS构建包含has_CUI和is_a关系的知识图谱;2) 采用TransE算法学习128维知识嵌入;3) 设计视觉对齐损失LVA
=(1-λ)LITC
LIKC
;4) 提出语义匹配损失LSM
替代传统InfoNCE损失;5) 使用ViT-B/16和GPT-2作为基础编码器,在ROCOv2数据集上微调15个epoch。

3.1 离线知识提取
研究构建了包含图像节点和UMLS概念节点(CUI)的混合知识图谱,通过TransE算法将节点映射为低维嵌入。消融实验表明,同时利用数据集内部知识(DK)和外部医学本体(EK)时,CUI@50指标提升最显著达53.92%,证实外部知识对建模医学概念层次关系的关键作用。

3.2 在线知识注入
视觉对齐(VA)方法通过联合优化图像-文本(LITC
)和图像-知识(LIKC
)对比损失,当λ=0.6时达到最佳平衡。语义匹配(SM)则利用知识嵌入计算相似度矩阵替代二元标签,在MEDICAT数据集上使检索准确率提升12%。两者结合的KL-CVRSM+VA
在牙齿植入体检索案例中实现100%相关结果,显著优于基线模型。

4.3 定量评估
在图像检索任务中,KL-CVRSM+VA
在ROCOv2测试集上的CUI@50达到53.92%,超过CLIP基线3.39个百分点。分类任务中,该方法在IRMA数据集解剖轴(A)分类的准确率达85.39%,接近15M数据训练的BioMedCLIP(86.68%)。

4.4 定性分析
t-SNE可视化显示KL-CVR学习到的特征空间具有更清晰的类间分离,如手腕(紫色)和手掌(蓝色)既保持语义关联又界限分明。检索案例显示该方法能准确识别"牙科植入体"等专业概念,证明知识注入有效提升了语义理解深度。

该研究开创性地将医学知识图谱与对比学习相结合,解决了传统VL模型在专业领域的适应性难题。通过知识嵌入桥接视觉与文本模态,不仅降低了对大规模数据的依赖,更通过建模概念层次关系提升了模型的临床可解释性。动态权重设计(γ)和知识正则化等技术贡献为多模态医学分析提供了新范式。未来可探索知识图谱的动态更新机制,以及将LLM(大语言模型)融入知识提取流程,进一步强化对新兴医学术语的捕捉能力。这项工作为突破医学AI的数据瓶颈和实现细粒度图像理解奠定了方法论基础。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号