基于联邦学习的分布式数据隐私保护睡眠分期分类方法研究

【字体: 时间:2025年05月19日 来源:Biomedical Signal Processing and Control 4.9

编辑推荐:

  针对多中心睡眠数据隐私保护与样本不足的难题,研究人员创新性地采用联邦学习(FL)框架,结合CNN-Transformer混合模型与抗类别比率(ACR)加权损失函数,实现了跨中心数据隐私保护下的高效睡眠分期分类。实验证明该方法在Sleep-EDF等数据库上性能优于传统本地学习,媲美集中式学习,为临床睡眠医学提供了兼顾隐私与效能的AI解决方案。

  

论文解读

睡眠作为人体重要的生理修复过程,全球约37.5%人群却饱受失眠、睡眠呼吸暂停等障碍困扰。传统基于多导睡眠图(PSG)的视觉分期方法依赖专家经验,存在主观性强、效率低下等问题。尽管深度学习在单中心睡眠分期中取得进展,但临床面临两大瓶颈:一是伦理限制导致样本稀缺,二是多中心数据因患者分布差异存在异质性。现有集中式训练模式更因隐私法规受限难以实施,使得先进算法难以落地。

为此,研究人员提出了一种基于联邦学习(FL)的分布式解决方案。通过整合三个公开数据库(Sleep-EDF、SHHS等)模拟多中心场景,构建了包含CNN特征提取器与Transformer编码器的混合模型,并设计抗类别比率(ACR)损失函数解决分期不平衡问题。关键技术包括:1)FL框架实现模型权重聚合而非原始数据交换;2)单通道脑电图(EEG)输入降低操作复杂度;3)多分辨率CNN与注意力机制捕捉睡眠动态特征。

性能对比基准方法
在SHHS数据集上,联邦学习以80.58%准确率显著优于本地学习(76.32%),且逼近集中式学习的81.04%。特别在易混淆的N1期识别中,FL的F1分数提升达9.2%,验证了跨中心知识迁移的有效性。

讨论与结论
该研究首次将FL引入睡眠分期领域,证明在数据不足时,FL能突破单中心数据局限,同时满足《通用数据保护条例》(GDPR)要求。CNN-Transformer架构通过局部特征与全局时序建模的协同,解决了PSG信号中类间相似性难题。ACR损失函数无需增加计算量即可缓解样本失衡,使N1期召回率提升15.7%。

这项发表于《Biomedical Signal Processing and Control》的工作,为分布式医疗AI提供了范式:既规避了数据跨境传输的法律风险,又通过知识共享提升了小样本机构的模型性能。未来可探索联邦迁移学习应对更大规模异质数据,推动睡眠医学的普惠化发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号