分布式协同机器学习在白细胞亚型分类中的跨域泛化研究:一种隐私保护框架下的解决方案

【字体: 时间:2025年08月12日 来源:Image and Vision Computing 4.2

编辑推荐:

  研究人员针对白细胞(WBC)亚型分类中存在的域偏移(domain shift)和隐私保护难题,创新性地探索了分布式协同机器学习(DCML)范式。通过系统评估早期融合(early fusion)、晚期融合(late fusion)和联邦学习(FL)三种DCML方法在四个WBC数据集上的表现,研究发现联邦学习能有效缓解域偏移问题,平均准确率提升达15.8%,同时满足医疗数据隐私保护要求。该研究为医疗AI领域提供了兼顾模型性能和隐私安全的解决方案。

  

在医学影像分析领域,白细胞(WBC)亚型分类对血液疾病诊断至关重要,但面临两大挑战:一是不同医疗机构间图像采集协议差异导致的域偏移(domain shift)问题,二是医疗数据隐私保护法规限制下的数据共享难题。传统解决方案如域适应(DA)和域泛化(DG)需要集中处理数据,难以满足隐私保护要求。意大利卡利亚里大学(University of Cagliari)电气与电子工程系的Lorenzo Putzu团队在《Image and Vision Computing》发表研究,创新性地将分布式协同机器学习(DCML)引入该领域,为解决这一矛盾提供了新思路。

研究采用ResNet-152、MobileNetV3、DenseNet-121等六种深度学习架构,在Raabin、AML、PBC和LDWBC四个公开WBC数据集上系统评估了三种DCML方法:早期融合通过权重平均整合模型;晚期融合在决策层合并多分支预测;联邦学习(FL)采用FedAVG算法进行分布式训练。关键技术包括交叉数据集验证策略(60%/20%/20%划分)、加权随机采样平衡类别不平衡,以及Grad-CAM和Eigen-CAM可视化技术。

研究结果显示,在跨数据集测试中,联邦学习表现最优。以ResNet-152为例,当PBC作为目标数据集时,FL的准确率(75.2%)显著高于中央化方法(52.5%)。可视化分析表明,FL生成的特征在t-SNE投影中展现出更好的类内聚集和类间分离特性。激活图谱显示FL能更准确定位WBC的关键形态学特征,而中央化方法常出现背景误激活。值得注意的是,当PBC数据集参与训练时,所有方法的泛化性能均有提升,表明该数据集具有较好的域代表性。

该研究证实DCML特别是联邦学习能有效缓解WBC分类中的域偏移问题,平均准确率提升达15.8%,同时满足GDPR等隐私法规要求。研究创新性地将DCML重新定义为一种隐私保护的域泛化方法,为医疗AI开发提供了新范式。未来可探索DCML与其他域适应方法的结合,以及扩展到其他医学影像分析任务。这项工作为平衡医疗AI的准确性和隐私安全性提供了重要参考,对推动分布式医疗协作具有重要意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号