
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于分层联邦学习与可解释人工智能的白血病诊断可信框架研究
【字体: 大 中 小 】 时间:2025年05月27日 来源:Informatics in Medicine Unlocked CS9.5
编辑推荐:
本研究针对急性淋巴细胞白血病(ALL)诊断中数据隐私保护与模型可解释性难题,创新性提出融合分层联邦学习(HFL)与可解释人工智能(XAI)的混合框架。采用EfficientNetB3模型在15,135例显微图像上实现96.5%的准确率,通过Saliency maps、Occlusion sensitivity和RISE技术提供可视化决策依据,HFL使通信成本降低15%且AUC达0.98,为医疗AI的伦理部署提供新范式。
在医疗人工智能领域,白血病诊断正面临双重挑战:既要保护患者敏感的医疗数据隐私,又要破解深度学习"黑箱"带来的信任危机。急性淋巴细胞白血病(ALL)作为儿童最常见的恶性肿瘤,其诊断依赖显微镜下区分恶性与正常细胞,但两者形态相似性导致传统方法准确率受限。更棘手的是,集中式训练需共享患者数据,而视网膜图像、MRI等医学影像可能泄露年龄、心血管风险等隐私信息,欧盟《通用数据保护条例》(GDPR)等法规更要求医疗AI必须提供决策追溯能力。
针对这些痛点,研究人员在《Informatics in Medicine Unlocked》发表创新研究,构建了首个融合分层联邦学习(Hierarchical Federated Learning, HFL)与可解释人工智能(eXplainable AI, XAI)的ALL诊断框架。该工作通过Kaggle公开的15,135张显微图像数据集,采用EfficientNetB3模型,引入边缘服务器(Edge Server, ES)层级优化传统联邦学习架构,并系统评估Saliency maps、Occlusion sensitivity和随机输入采样解释(RISE)三种XAI技术的表现。
关键技术方法包括:1) 设计三级HFL架构(客户端-ES-全局服务器)实现多中心协作训练;2) 采用旋转、亮度调整等数据增强策略将数据集扩增3倍;3) 使用Adamax优化器配合0.45 dropout率防止过拟合;4) 通过插入(Insertion)、删除(Deletion)和保真度(Fidelity)评分量化XAI效果。
【模型性能】
实验显示HFL框架准确率达96.5%,较基线模型提升2.5%,F1-score提高5.4%至94.4%。ROC曲线显示AUC为0.98,证明模型卓越的判别能力。与传统集中式学习相比,HFL在保持数据隐私前提下,仅牺牲3.4%准确率但获得15%通信成本优化。
【跨中心验证】
四客户端测试表明:传统联邦学习使各客户端在交叉验证时F1-score提升4.6-8.8%,如Client3对其他客户端数据识别率从0.859升至0.907,证实HFL显著改善模型泛化能力。
【可解释性分析】
Saliency maps在保真度(0.184)和特征抑制(-0.264 Deletion)表现最优,而Occlusion sensitivity在关键特征识别(1.129 Insertion)更突出。如图9所示,XAI技术成功定位细胞核异型性等诊断关键区域,辅助临床解读。
【鲁棒性验证】
在淋巴细胞亚型分类(LSC)和白血病细胞图像(LCI)数据集测试中,模型保持93.8-95.2%准确率,AUC稳定在0.96以上,证实其跨数据集适应性。
该研究的突破性在于:首次实现隐私保护与模型可解释性的协同优化,HFL架构有效解决医疗数据"孤岛"问题,XAI技术使AI决策过程符合GDPR合规要求。提出的分层聚合算法(Algo1)为多中心研究提供可扩展方案,而系统性XAI评估体系为医疗AI透明性建立新标准。未来可探索更多细胞形态学特征与分子标志物的关联解释,推动AI辅助诊断向精准医学迈进。
生物通微信公众号
知名企业招聘