
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多目标联邦强化学习的1型糖尿病隐私保护血糖管理:PRIMO-FRL框架的开发与验证
【字体: 大 中 小 】 时间:2025年07月09日 来源:JMIR Diabetes CS4.0
编辑推荐:
推荐:本研究针对传统强化学习(RL)在糖尿病管理中单目标优化和隐私泄露的局限性,开发了PRIMO-FRL框架,通过联邦强化学习(FRL)实现多目标血糖调控(TIR 76.54%、零低血糖事件),为隐私敏感的医疗环境提供安全可扩展的AI解决方案。
血糖管理是糖尿病治疗的核心挑战,尤其是对于依赖外源性胰岛素的1型糖尿病患者。当前的人工胰腺系统虽能自动化调控,却受限于固定算法难以适应个体差异,而传统机器学习方法又面临数据隐私与多目标平衡的困境——既要维持70-180 mg/dL的血糖目标范围(TIR),又要避免胰岛素过量和血糖波动。更棘手的是,集中式训练需共享敏感健康数据,违反GDPR等隐私法规。这些矛盾催生了PRIMO-FRL框架的诞生。
研究人员通过整合联邦学习(FL)与多目标强化学习(RL),构建了去中心化的血糖调控系统。该框架采用FDA批准的UVA/Padova模拟器生成30例虚拟患者(儿童/青少年/成人各10例)数据,在本地设备训练软演员-评论家(SAC)智能体,仅通过加密模型参数更新实现协同优化。关键技术包括:动态权衡血糖稳定性与胰岛素效率的熵奖励函数、基于门控循环单元(GRU)的时序决策网络、以及跨患者群体的联邦平均聚合算法。
研究结果
Glycemic Control Outcomes
PRIMO-FRL整体TIR达76.54%,其中成人组最优(81.48%),且完全消除低血糖(<70 mg/dL)。青少年组轻度高血糖(180-250 mg/dL)发生率为29.63%,显著优于传统RL方法。
Risk Improvement and Stability Analysis
24小时血糖轨迹显示,代表性患者(如child#001)的血糖波动幅度减少68%,风险评分持续下降,证明多目标奖励机制能有效抑制极端血糖事件。
Comparative Analysis
相较于集中式RL-Scratch方案(低血糖率0.73%),本框架在保持隐私的同时将安全边际提升至零风险,且TIR提高3.5个百分点。
结论与意义
该研究开创性地将联邦学习引入慢性病管理,其价值体现在三方面:临床层面,通过多目标优化首次实现零低血糖与TIR>70%的协同;技术层面,采用GRU网络处理CGM(连续血糖监测)数据延迟噪声;隐私层面,模型训练全程无需原始数据交换。未来可扩展至真实世界胰岛素泵-CGM闭环系统,为代谢性疾病AI诊疗树立隐私保护新范式。论文发表于《JMIR Diabetes》,为数字医疗领域首个融合FRL与熵奖励的血糖调控研究。
生物通微信公众号
知名企业招聘