基于联邦学习的分布式数据隐私保护睡眠分期分类方法研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年05月19日 来源：Biomedical Signal Processing and Control 4.9

编辑推荐：

　　针对多中心睡眠数据隐私保护与样本不足的难题，研究人员创新性地采用联邦学习（FL）框架，结合CNN-Transformer混合模型与抗类别比率（ACR）加权损失函数，实现了跨中心数据隐私保护下的高效睡眠分期分类。实验证明该方法在Sleep-EDF等数据库上性能优于传统本地学习，媲美集中式学习，为临床睡眠医学提供了兼顾隐私与效能的AI解决方案。

论文解读

睡眠作为人体重要的生理修复过程，全球约37.5%人群却饱受失眠、睡眠呼吸暂停等障碍困扰。传统基于多导睡眠图（PSG）的视觉分期方法依赖专家经验，存在主观性强、效率低下等问题。尽管深度学习在单中心睡眠分期中取得进展，但临床面临两大瓶颈：一是伦理限制导致样本稀缺，二是多中心数据因患者分布差异存在异质性。现有集中式训练模式更因隐私法规受限难以实施，使得先进算法难以落地。

为此，研究人员提出了一种基于联邦学习（FL）的分布式解决方案。通过整合三个公开数据库（Sleep-EDF、SHHS等）模拟多中心场景，构建了包含CNN特征提取器与Transformer编码器的混合模型，并设计抗类别比率（ACR）损失函数解决分期不平衡问题。关键技术包括：1）FL框架实现模型权重聚合而非原始数据交换；2）单通道脑电图（EEG）输入降低操作复杂度；3）多分辨率CNN与注意力机制捕捉睡眠动态特征。

性能对比基准方法
在SHHS数据集上，联邦学习以80.58%准确率显著优于本地学习（76.32%），且逼近集中式学习的81.04%。特别在易混淆的N1期识别中，FL的F1分数提升达9.2%，验证了跨中心知识迁移的有效性。

讨论与结论
该研究首次将FL引入睡眠分期领域，证明在数据不足时，FL能突破单中心数据局限，同时满足《通用数据保护条例》（GDPR）要求。CNN-Transformer架构通过局部特征与全局时序建模的协同，解决了PSG信号中类间相似性难题。ACR损失函数无需增加计算量即可缓解样本失衡，使N1期召回率提升15.7%。

这项发表于《Biomedical Signal Processing and Control》的工作，为分布式医疗AI提供了范式：既规避了数据跨境传输的法律风险，又通过知识共享提升了小样本机构的模型性能。未来可探索联邦迁移学习应对更大规模异质数据，推动睡眠医学的普惠化发展。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号