基于仿真到现实的广义多任务学习框架:血糖预测与低血糖检测的跨域泛化突破
《npj Digital Medicine》:Generalized multi task learning framework for glucose forecasting and hypoglycemia detection using simulation to reality
【字体:
大
中
小
】
时间:2025年10月17日
来源:npj Digital Medicine 15.1
编辑推荐:
为解决自动胰岛素输送(AID)系统中血糖预测与低血糖事件检测任务分离、泛化能力不足及真实数据依赖度高的问题,研究人员开发了领域无关持续多任务学习(DA-CMTL)框架,集成多任务学习(MTL)、持续学习(CL)和仿真到现实(Sim2Real)迁移策略。该框架在30分钟预测范围内达到RMSE 14.01 mg/dL,灵敏度/特异性92.13%/94.28%,动物实验显示低于范围时间(TBR)从3.01%降至2.58%,为AID系统提供了高效安全层解决方案。
在1型糖尿病(T1DM)管理中,自动胰岛素输送(AID)系统通过实时调整胰岛素剂量显著改善了血糖控制水平。然而,现有系统面临三大核心挑战:首先,血糖水平预测与低血糖事件检测通常被设计为独立任务,导致系统结构复杂且输出不同步;其次,模型容易过拟合特定数据集,难以泛化到不同人群和设备;第三,真实临床数据收集成本高昂且存在伦理限制,单个患者一年数据收集成本超过2940美元,且需面临长达一年的伦理审批流程。
为突破这些瓶颈,浦项科技大学Sung-Min Park团队在《npj Digital Medicine》发表了创新性研究,提出领域无关持续多任务学习(DA-CMTL)框架。该研究通过多任务学习架构同时处理血糖值回归预测和低血糖事件分类,采用仿真到现实迁移策略利用UVA/Padova模拟器生成大量虚拟患者数据,并引入弹性权重巩固(EWC)方法防止持续学习过程中的灾难性遗忘。
研究采用门控循环单元(GRU)为核心架构,输入连续血糖监测(CGM)和胰岛素在体(IOB)数据,通过多头结构输出连续血糖预测值(?reg)和二元低血糖分类结果(?clf)。模型训练采用三个公共数据集(DiaTrend、OhioT1DM和ShanghaiT1DM)进行验证,并通过糖尿病诱导大鼠模型进行体内实验评估。
研究采用模拟器生成包含不同血糖风险特征的虚拟患者数据,低低血糖风险(LHR)和高低血糖风险(HHR)群体分别代表稳定和易变血糖模式。通过持续学习策略顺序训练多个域,使用弹性权重巩固(EWC)正则化防止遗忘。多任务学习同时优化回归损失(均方误差)和分类损失(交叉熵),最终通过蒙特卡洛丢弃(MC-dropout)进行不确定性估计。
在30分钟预测范围内,DA-CMTL在三个数据集上均表现出色:ShanghaiT1DM的RMSE为10.58 mg/dL,OhioT1DM为13.38 mg/dL,DiaTrend为15.74 mg/dL。低血糖事件检测灵敏度达到92.13%-98.58%,特异性为94.28%-98.23%。克拉克误差网格分析(CEGA)显示临床可接受区域(A+B区)比例超过98%,其中ShanghaiT1DM的A区比例高达98.74%。
研究发现持续学习的域顺序显著影响模型性能。当采用从低风险到高风险(LHR→HHR)的课程学习策略时,模型在所有数据集上的灵敏度平均提升18.24%,且RMSE保持稳定。这种渐进式学习方式帮助模型先建立稳定的时间表征,再适应高变异性的血糖模式。
移除多任务学习中的分类任务后,虽然RMSE略有改善(10.24-15.82 mg/dL),但低血糖检测灵敏度大幅下降22.41%-38.97%。移除持续学习组件后,模型出现严重过拟合,RMSE增加至13.80 mg/dL。完整DA-CMTL框架在综合性能指标上表现最优,在三个数据集上的性能面积分别为1.25、1.24和1.61。
与当前最先进模型相比,DA-CMTL在30分钟预测范围内表现最佳:在ShanghaiT1DM上比时序融合变压器(TFT)低8.52 mg/dL,比图注意力循环神经网络(GARNN)低3.04 mg/dL;在OhioT1DM上比TFT低5.72 mg/dL,比GARNN低5.59 mg/dL。个性化微调仅需2天数据即可达到竞争性性能,体现了框架的高效适应性。
通过聚类分析发现,高糖化血红蛋白(HbA1c)与低检测灵敏度显著相关(ρ=-0.82),而高变异系数(CV)与高RMSE显著相关(ρ=0.75)。集群4患者(高HbA1c、低CV)虽然预测误差低,但因低血糖事件稀少而导致检测灵敏度最低,揭示了模型在不同临床特征群体中的性能差异。
在31天体外模拟中,基于DA-CMTL的安全层(SL)将低于范围时间(TBR)从7.15%显著降低至0.50%(p=0.0013),同时将时间在范围内(TIR)从55.39%提高至59.89%(p=0.0025)。在大鼠体内实验中,虽然TBR有所增加,但这主要归因于物种间生理差异和无法进行碳水化合物校正的限制。
该研究开发的DA-CMTL框架成功解决了AID系统中的三个关键问题:通过多任务学习整合了预测与检测任务,通过仿真到现实迁移减少了真实数据依赖,通过持续学习实现了跨域泛化。框架在保持轻量级设计的同时,在30分钟预测范围内达到临床可接受的准确性,适合集成到实时AID系统中。
研究的主要创新点在于将课程学习理念引入血糖预测领域,通过从简单到复杂的域调度策略增强模型泛化能力;同时明确将低血糖检测建模为分类任务而非简单阈值判断,显著提高了安全关键性能。
局限性与未来方向包括:60分钟预测性能下降源于GRU架构的长程依赖限制,未来可探索Transformer架构;当前仅使用CGM和IOB数据,未来可融入膳食、运动等情境因素;体内验证仅在T2DM大鼠模型进行,未来需在T1DM模型和人类队列中进一步验证。
该框架为人工智能驱动的血糖控制技术提供了实用基础,特别适合移动或资源受限环境下的实时应用,推动了可扩展自适应胰岛素输送解决方案的发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号