基于通用自监督表征的多人群联邦学习提升胸部X光分析性能研究

【字体: 时间:2025年06月20日 来源:European Journal of Radiology Artificial Intelligence

编辑推荐:

  本研究针对医疗影像分析中数据隐私保护与非独立同分布(non-IID)数据挑战,创新性地将通用自监督学习(SSL)表征与联邦学习(FL)框架结合,通过分析全球5个机构超40万例成人及儿童胸片数据证实:传统FL在非IID环境下性能受限,而采用DINOv2自监督权重的SSL+FL方案显著提升儿科病例(P=0.031)及多数成人数据集(P≤0.007)的诊断效能,为跨机构医疗AI协作提供新范式。

  

医疗人工智能发展面临两大核心矛盾:一方面,高质量医疗影像数据分散在各机构形成"数据孤岛";另一方面,集中式训练面临隐私泄露风险。更棘手的是,现实中的医疗数据具有显著的非独立同分布(non-IID)特性——不同机构的设备、标注标准、患者 demographics(人口统计学特征)存在差异,尤其是儿科与成人数据间的解剖生理差异,使得传统联邦学习(FL)在跨机构协作时效果受限。

针对这一难题,研究人员在《European Journal of Radiology Artificial Intelligence》发表创新研究。团队系统分析了来自越南、美国、西班牙等国的407,648例胸片(含9,125例儿科数据),首次将Meta AI开发的DINOv2自监督表征与FL框架结合,构建了SSL+FL新范式。研究采用严格配对实验设计,在VinDr-CXR、ChestX-ray14等5个差异显著的数据库上对比了传统FL与SSL+FL的效能。

关键技术包括:1) 采用Vision Transformer(ViT)架构处理224×224像素胸片;2) 基于DINOv2的SSL预训练权重初始化模型;3) 联邦平均(FedAvg)算法聚合5个虚拟站点的参数更新;4) 通过加权交叉熵损失解决类别不平衡;5) 采用AUROC(受试者工作特征曲线下面积)等指标进行系统评估。

【Federated learning shows greater benefits for smaller adult chest X-ray datasets in non-IID settings】
对数据量较小的VinDr-CXR(n=15,000),传统FL使平均AUROC从91.15%提升至93.67%(P<0.001),证实FL对小规模数据的增益。但ChestX-ray14(n=86,524)仅获2.32%的边际改善,揭示数据规模与FL效益的非线性关系。

【Federated learning performance declines with increasing non-IID effects】
儿科数据(n=7,728)在传统FL中仅获0.69%的AUROC提升(P=0.242),而最大数据集CheXpert(n=128,356)反而出现1.67%的性能下降(P<0.001),凸显非IID效应对FL的负面影响。

【Self-supervised image representations enable pediatric chest X-rays to benefit from federated learning】
引入SSL权重后,儿科数据AUROC显著提升1.96%(P=0.031),肺炎分类单项指标提升达5.00%(P<0.001),证明SSL能有效弥合成人与儿童数据的分布差异。

【Self-supervised image representations enhance FL performance】
在PadChest数据集上,SSL+FL逆转传统FL的劣势,使AUROC较本地训练提升0.54%(P=0.007)。即使是最大的CheXpert数据集,性能差距也从1.67%缩小至0.69%(P=0.052)。

这项研究开创性地证实:通用自监督表征能有效解决FL在医疗影像中的非IID挑战,特别是为儿科等特殊人群的AI诊断开辟新路径。其价值体现在三方面:首先,SSL+FL框架使小规模/特殊数据集能从大规模数据协作中获益,缓解医疗AI的"马太效应";其次,该方法仅需部署预训练权重,无需改变现有FL基础设施,具有临床易用性;最后,研究揭示视觉基础模型(如DINOv2)在跨模态医疗迁移学习中的潜力。未来工作可探索更高分辨率输入及更多病种的扩展应用,推动精准医疗的普惠发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号