
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于联邦学习的分布式数据隐私保护睡眠分期分类方法研究
【字体: 大 中 小 】 时间:2025年05月19日 来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
针对多中心睡眠数据隐私保护与样本不足的难题,研究人员创新性地采用联邦学习(FL)框架,结合CNN-Transformer混合模型与抗类别比率(ACR)加权损失函数,实现了跨中心数据隐私保护下的高效睡眠分期分类。实验证明该方法在Sleep-EDF等数据库上性能优于传统本地学习,媲美集中式学习,为临床睡眠医学提供了兼顾隐私与效能的AI解决方案。
论文解读
睡眠作为人体重要的生理修复过程,全球约37.5%人群却饱受失眠、睡眠呼吸暂停等障碍困扰。传统基于多导睡眠图(PSG)的视觉分期方法依赖专家经验,存在主观性强、效率低下等问题。尽管深度学习在单中心睡眠分期中取得进展,但临床面临两大瓶颈:一是伦理限制导致样本稀缺,二是多中心数据因患者分布差异存在异质性。现有集中式训练模式更因隐私法规受限难以实施,使得先进算法难以落地。
为此,研究人员提出了一种基于联邦学习(FL)的分布式解决方案。通过整合三个公开数据库(Sleep-EDF、SHHS等)模拟多中心场景,构建了包含CNN特征提取器与Transformer编码器的混合模型,并设计抗类别比率(ACR)损失函数解决分期不平衡问题。关键技术包括:1)FL框架实现模型权重聚合而非原始数据交换;2)单通道脑电图(EEG)输入降低操作复杂度;3)多分辨率CNN与注意力机制捕捉睡眠动态特征。
性能对比基准方法
在SHHS数据集上,联邦学习以80.58%准确率显著优于本地学习(76.32%),且逼近集中式学习的81.04%。特别在易混淆的N1期识别中,FL的F1分数提升达9.2%,验证了跨中心知识迁移的有效性。
讨论与结论
该研究首次将FL引入睡眠分期领域,证明在数据不足时,FL能突破单中心数据局限,同时满足《通用数据保护条例》(GDPR)要求。CNN-Transformer架构通过局部特征与全局时序建模的协同,解决了PSG信号中类间相似性难题。ACR损失函数无需增加计算量即可缓解样本失衡,使N1期召回率提升15.7%。
这项发表于《Biomedical Signal Processing and Control》的工作,为分布式医疗AI提供了范式:既规避了数据跨境传输的法律风险,又通过知识共享提升了小样本机构的模型性能。未来可探索联邦迁移学习应对更大规模异质数据,推动睡眠医学的普惠化发展。
生物通微信公众号
知名企业招聘