基于个性化联邦学习的血糖极端值预测新方法:FedGlu模型与HH损失函数在1型糖尿病管理中的突破
《Scientific Reports》:A personalized federated learning-based glucose prediction algorithm for high-risk glycemic excursion regions in type 1 diabetes
【字体:
大
中
小
】
时间:2025年11月04日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对1型糖尿病(T1D)血糖预测中极端血糖事件(低血糖和高血糖)数据稀缺和患者数据隐私保护的双重挑战,提出了一种创新解决方案。研究团队开发了新型Hypo-Hyper(HH)损失函数,通过差异化惩罚机制显著提升血糖极端值区域的预测精度;同时构建了FedGlu模型,在联邦学习(FL)框架下实现协同建模而无需共享敏感数据。结果显示,HH损失函数使低血糖预测RMSE降低46%,FedGlu模型对105/125患者同时改善低血糖和高血糖预测。这项工作为糖尿病精准管理提供了兼顾预测性能与隐私保护的新范式。
在全球范围内,糖尿病影响着近5.37亿人的健康,另有3.74亿人处于糖尿病前期状态。这种慢性疾病可能导致失明、肾衰竭、截肢、心脏病等严重并发症,甚至在极端情况下导致死亡。对于1型糖尿病(T1D)患者而言,血糖管理尤为关键,因为他们需要终身依赖胰岛素治疗。
连续血糖监测(CGM)设备的出现革新了糖尿病管理方式,能够提供实时血糖读数,帮助患者更好地控制血糖水平。然而,当前血糖预测技术仍面临两大挑战:一方面,在血糖极端值区域(低血糖和高血糖)的预测准确性不足,这些区域的数据稀少但临床意义重大;另一方面,敏感患者数据的隐私问题限制了强大机器学习模型的开发,即使有先进的深度学习算法可用。
传统的血糖预测方法往往使用均方误差(MSE)作为损失函数,但这种做法存在明显缺陷。由于低血糖事件仅占血糖读数的2-10%,高血糖约占30-40%,而正常血糖范围占大部分,MSE会倾向于优化主要类别(正常血糖)的预测性能,而忽视对临床更为关键但数据稀少的极端血糖事件的预测。
为了解决这些挑战,德克萨斯A&M大学和普渡大学的研究团队在《Scientific Reports》上发表了一项创新研究,提出了一种结合新型损失函数和联邦学习框架的解决方案。他们开发了Hypo-Hyper(HH)损失函数,专门针对血糖极端值区域的预测优化,同时构建了FedGlu模型,在保护数据隐私的前提下实现多中心协同学习。
研究团队为开展这项研究采用了几个关键技术方法:使用OhioT1DM公开数据集(12名患者)和TCH专有数据集(113名患者)的连续血糖监测数据;提出基于Taguchi损失函数原理的HH损失函数,通过参数α平衡不同血糖区域的惩罚权重;构建多层感知器(MLP)模型架构,采用联邦学习框架进行模型训练,并通过个性化微调实现患者特异性适配;使用5折时间分区验证策略和克拉克误差网格分析(CEGA)进行性能评估。
研究团队提出的HH损失函数基于Taguchi损失函数原理,通过在血糖极端值区域施加多项式增加的惩罚项,显著提升了这些关键区域的预测性能。具体而言,当血糖值低于70mg/dL(低血糖)或高于180mg/dL(高血糖)时,损失函数会增加额外惩罚,惩罚量与血糖值偏离正常范围中点的平方成正比。这种设计迫使模型更加关注临床风险最高的血糖区域。
在TCH研究数据上,HH损失函数使低血糖区域的均方根误差(RMSE)降低了52%,同时保持了高血糖区域的预测性能。尽管整体血糖预测的RMSE值略有下降,但通过克拉克误差网格分析评估的临床意义不仅未受影响,反而有所提升。使用HH损失函数时,未能检测到的血糖波动仅占0.51%,而使用MSE时这一比例为2.07%,意味着检测能力提高了75%。
在OhioT1DM数据集上,HH损失函数同样表现出色,低血糖区域的RMSE降低了41%。更重要的是,落在克拉克误差网格D+E区域(可能导致治疗错误的数据点)的比例从2.06%降至0.38%,降幅达84%,显著提升了模型的临床安全性。
研究比较了局部模型、中心模型和联邦模型三种架构的性能差异。局部模型仅在单个患者数据上训练,保护隐私但预测性能有限;中心模型汇集所有患者数据训练单一模型,性能优越但隐私风险高;联邦模型则折中二者优点,通过在本地训练模型并仅共享模型参数实现协同学习。
FedGlu作为研究提出的个性化联邦学习模型,采用两阶段训练策略:首先在联邦学习框架下使用MSE损失函数训练全局模型,然后使用HH损失函数对全局模型进行个性化微调。这种方法既利用了多中心数据的多样性,又适应了个体患者的特异性。
结果显示,与局部模型相比,联邦模型在低血糖预测上改善了16.67%(RMSE),在高血糖预测上改善了18.91%。在TCH研究数据中,联邦模型对96/113名患者的低血糖预测和110/111名患者的高血糖预测优于局部模型。虽然中心模型因数据优势仍表现最佳,但联邦模型在保护隐私的同时实现了接近中心模型的性能。
HH损失函数中的参数α在平衡低血糖和高血糖区域的预测性能方面起着关键作用。较高的α值优先考虑低血糖区域的性能,而较低的α值则强调高血糖区域的预测。研究发现,随着α值增加,低血糖预测的改善呈指数增长,而高血糖预测的改善则呈下降趋势,但变化幅度较小。这种差异源于数据不平衡——低血糖值的中位数仅为1.64%,而高血糖值的中位数高达43%。
α参数的可调性使临床医生能够根据患者的个体风险状况定制模型。对于低血糖风险较高的患者,可以选择较高的α值;而对于高血糖为主要问题的患者,则可选择较低的α值。这种灵活性增强了临床实用性。
研究进一步分析了不同血糖特征患者从联邦学习中获益程度的差异。对于低血糖预测,随着患者低血糖值比例的增加,联邦模型、中心模型和局部模型的性能趋于一致。低血糖事件极少的患者从中心模型中获益最大,因为中心模型能够从其他患者的低血糖数据中学习。相反,对于高血糖预测,三种模型类型的性能差异较小,且与患者的高血糖特征无明显关联。
研究还将HH损失函数与最近提出的归一化均方误差(NMSE)进行了比较。在TCH研究数据上,HH损失在低血糖区域的表现比NMSE好29%,在高血糖区域好5%。在OhioT1DM数据集上,相应改善分别为21%和6%。此外,HH损失函数的克拉克误差网格D+E区域比例(0.51%)显著低于NMSE(1.47%)和MSE(2.07%)。
与使用相同OhioT1DM数据集的最新研究相比,本研究的简单MLP模型在参数数量少数百倍的情况下,实现或超越了最先进模型的性能。联邦模型尽管无法访问全部训练数据,仍表现出与文献中多种先进方法相媲美的结果。
研究的讨论部分指出,虽然HH损失函数在整体血糖预测的RMSE指标上引入了偏差,但通过克拉克误差网格分析证明这种偏差并未损害临床安全性,反而显著提升了对关键血糖事件的检测能力。联邦学习框架的采用使得模型能够在保护敏感患者数据的同时,利用多中心数据的多样性,为现实世界的临床部署提供了可行路径。
FedGlu框架的设计考虑了未来临床集成的需求,其分散式特性与现有医疗数据流兼容。在多机构设置中,联邦学习模型已证明能够在医院规模成功应用,无需集中受保护数据即可改善泛化能力。可调参数α允许根据个体优先级和血糖目标实现个性化,这一特性增强了临床实用性。
研究的局限性包括需要两阶段训练过程以及联邦学习在现实世界中应用的相关挑战,如网络中实体的不可用性。作者计划在后续工作中通过添加隐私保证和改进学习算法来解决这些限制。
这项研究的结论强调,新提出的HH损失函数可同时改善低血糖和高血糖区域的预测,而不影响整体预测性能。平均而言,跨两个数据集(共125名患者)的血糖波动检测能力比标准MSE损失提高了78%。通过FedGlu实现的联邦学习方法明显优于局部模型(血糖波动检测能力提高35%),同时接近中心模型的性能。这些结果证明了开发具有强大预测能力并能保护敏感患者医疗数据的机器学习模型的必要性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号