基于原型跨模态对比学习的法医病理学大规模词汇分析系统SongCi的开发与验证

【字体: 时间:2025年07月25日 来源:Nature Communications 14.7

编辑推荐:

  本研究针对法医病理学领域存在的诊断结果变异性大、流程劳动密集和专业人才短缺等挑战,开发了名为SongCi的视觉-语言模型。通过原型跨模态自监督对比学习技术,该模型在包含1600万高分辨率图像块和471种诊断结果的多中心数据集上进行预训练,实现了与资深法医病理学家相当的诊断准确性,显著优于初级从业者。研究发表于《Nature Communications》,为法医病理学提供了首个具有多模态可解释性的大规模词汇分析工具。

  

在法医病理学领域,确定死因和死亡方式依赖于尸检的宏观与微观检查。然而,这一过程面临三大挑战:诊断结果存在主观变异性(如不同经验水平的病理学家对同一案例可能得出不同结论)、分析流程耗时费力(单个全切片图像分析需数小时)、以及专业人才严重短缺。这些问题导致法医病理学领域亟需智能化的辅助工具,但现有临床病理AI模型因训练数据(主要基于癌症样本)与任务需求(需覆盖创伤、疾病和死后变化等多类诊断)存在显著领域差异而难以直接应用。

西安交通大学法医司法鉴定中心的研究团队开发了名为SongCi的视觉-语言模型,通过创新的原型跨模态对比学习框架,在包含9种器官、2228对视觉-语言数据和471种诊断结果的多中心数据集上进行预训练。该研究发表于《Nature Communications》,首次实现了法医病理学领域的大规模词汇分析能力,其诊断准确性与资深法医病理学家相当,分析效率却提高近20倍。

关键技术方法包括:1) 基于原型对比学习的图像编码器预训练,从3.15百万图像块中提取933个组织原型;2) 门控注意力增强的多模态融合模块,整合器官水平的宏观发现(文本)与组织水平的微观特征(图像);3) 零样本推理框架,支持对未见过的诊断类型进行预测。所有实验均通过三中心队列验证,包含内部队列(1451样本)和两个外部验证队列(共777样本)。

研究结果部分显示:

可视化不同器官的死后全切片图像原型
通过UMAP降维可视化933个学习到的原型,发现其自发形成器官特异性(如心肌肥大)和跨器官共享(如自溶、炎症)两类聚类。条件扩散模型生成的图像证实,这些原型能精确控制生成具有特定病理特征的图像块(如肝假小叶结构)。

自监督全切片图像分割
相比传统聚类方法(H2T和PANTHER),SongCi的原型分割在脾脏、脑组织等器官中实现了更精细的结构区分(IOU提升10-20%),且计算效率显著提高。

大规模词汇法医诊断
在零样本设置下,SongCi在外部队列中的平均召回率达0.778±0.091,显著优于6种现有多模态模型(如IRENE和MCAT)。对于低频诊断(出现<10次的标签),其召回率仍保持0.366,展现强大的泛化能力。

与法医病理学家的比较
在100例盲测样本中,SongCi的诊断准确率(召回率0.836)与15年经验资深病理学家(0.797)相当,且分析时间仅需0.37小时,而人工平均需7小时。

讨论部分指出,SongCi的创新性体现在三方面:1) 通过原型对比学习解决了法医样本的复杂形态变异问题;2) 门控注意力机制实现了宏观-微观证据的可解释融合;3) 零样本学习框架支持开放式诊断词汇表。局限性在于当前数据偏重于9种主要器官,未来需扩展至更广泛的病理场景。该模型不仅可提升尸检效率,其跨模态可解释性特征(如高亮关键文本术语和图像区域)更有助于增强司法鉴定结论的可信度。



相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号