Towards generalizable Federated Learning in medical imaging: A real-world case study on mammography data:乳腺癌影像诊断的新突破
编辑推荐:
在医疗领域,AI 发展受数据隐私与法规限制。研究人员开展基于乳腺 X 线数据的联邦学习(FL)研究,构建端到端 FL 框架。结果显示该框架提升了模型性能,使 FL 与集中式模型性能相近,为医疗 AI 发展提供新思路。
在医疗行业,临床工作流程长期依赖人工决策,这导致了诸多问题,如检查流程延误、医疗专业人员工作负担过重等。随着人工智能(AI)技术的兴起,人们期望利用其设计和开发自动化工具,辅助医疗专业人员,提升临床工作效率。然而,AI 算法的训练需要大量集中的数据来确保其泛化性,在医疗应用场景中,这与严格的隐私保护法规(如 GDPR)相冲突,数据隐私问题成为了医疗 AI 发展的重大阻碍。
为了解决这些难题,来自希腊和塞尔维亚相关机构的研究人员开展了关于乳腺 X 线摄影数据的联邦学习(Federated Learning,FL)研究。联邦学习是一种机器学习方法,多个分布式设备可协作训练一个共享模型,在医疗领域应用时,敏感的患者数据能够保留在医院本地,从而在一定程度上解决数据隐私问题。研究人员通过对比经典模型训练和联邦学习变体,探索将集中式医学 AI 模型训练工作流程转换为联邦学习模式所需的调整和优化,致力于实现更具泛化性的联邦学习,以推动医疗影像领域 AI 技术的发展。该研究成果发表在《Computational and Structural Biotechnology Journal》上,为医疗 AI 的发展提供了新的方向和思路。
在研究方法上,研究人员主要运用了以下关键技术:一是利用来自希腊和塞尔维亚三家医院的乳腺 X 线摄影数据构建数据集,这些数据涵盖不同患者情况且经过筛选处理;二是采用联邦学习技术,基于 FedAvg 合并函数设计了一个语言无关的基于 Kubernetes 的框架,该框架能够协调模型训练和聚合过程;三是对图像进行预处理,包括依据 DICOM 属性调整像素值、翻转图像、调整分辨率等,还引入乳腺区域检测(Breast Area Detection,BAD)工具去除图像中的标签和其他干扰信息。
在研究结果方面:
- 实验设置:研究人员分别以集中式和联邦学习方式训练 BIRADS 分类模型,模型架构基于卷积神经网络(Convolutional Neural Networks,CNN)。集中式训练使用 100 个 epoch,联邦学习则测试了 100 轮 - 1 个 epoch、50 轮 - 2 个 epoch 和 20 轮 - 5 个 epoch 三种组合。
- 经典实验:集中式训练时,对数据进行归一化处理,按照特定的训练和评估流程进行模型训练,确定了一组超参数,如损失函数为交叉熵损失、学习率为 10-8、优化器为 Adam、批量大小为 10、训练 100 个 epoch。
- 适应联邦学习:在初始适应阶段,联邦学习实验中发现医院 1 的模型性能严重下降,F1 分数降低约 40%。分析发现这是由于不同医院数据差异大,部分图像未在训练中充分考虑。在改进预处理适应阶段,加入完整的预处理流程(包括 BAD 工具处理)后,所有医院模型性能均提升,医院 1 的准确率与经典版本接近,且不同轮次和 epoch 组合下模型收敛结果相似,其中 50 轮 - 2 个 epoch 的组合训练时间最短。
研究结论和讨论部分指出,联邦学习在医疗领域虽前景广阔,但并非 “即插即用” 的解决方案。数据的不均匀性会导致模型不准确,影响模型的收敛和泛化能力,数据的同质化处理对模型的有效性和泛化性至关重要。在联邦学习训练前对数据进行整理、确保数据隐私安全、考虑 IT 人员和硬件资源以及合理权衡联邦学习轮次和本地 epoch 等因素,对于成功实施联邦学习都十分关键。该研究强调了通过图像处理技术协调数据的重要性,即便经典训练在使用不同数据时可能没有明显问题,但在联邦学习中,由于无法直接访问数据,需要采用如联邦分析(Federated Analytics)等机制来处理数据。同时,研究还指出医院应积极参与数据管理,协助研究人员更好地利用联邦学习进行数据建模,而非仅仅提供计算资源和数据。这项研究为未来医疗领域联邦学习的应用和发展提供了宝贵的经验和指导,有助于推动医疗 AI 技术在保障数据隐私的前提下更有效地发展,为临床诊断提供更可靠的支持。