
-
生物通官微
陪你抓住生命科技
跳动的脉搏
利用堆叠集成方法和灰狼优化算法提升1型糖尿病患者血糖预测精度
【字体: 大 中 小 】 时间:2025年05月27日 来源:Endocrine and Metabolic Science CS2.8
编辑推荐:
推荐 为解决1型糖尿病患者血糖预测精度不足的问题,研究人员利用DiaTrend数据集,结合堆叠集成学习方法和灰狼优化算法,构建并评估了多种血糖预测模型。结果表明,XGBoost堆叠集成模型在MAE、RMSE和MARD指标上均优于单一基线模型,显著提升了预测精度,对糖尿病管理和个性化治疗具有重要意义。
论文解读
糖尿病是全球范围内导致疾病和死亡的主要原因之一,2022年全球有8.28亿成年人患有糖尿病1。其中,1型糖尿病(T1D)占所有糖尿病病例的约2%,其患病率在不同国家和地区差异较大2。准确的血糖预测对于预防糖尿病相关并发症和提高患者生活质量至关重要。近年来,随着可穿戴医疗设备的普及,连续血糖监测(CGM)数据的获取变得更加便捷,为基于机器学习的血糖预测提供了丰富的数据支持3。然而,如何从这些数据中提取有效信息以提高预测精度仍是一个挑战。为此,研究人员利用DiaTrend数据集,结合堆叠集成学习方法和灰狼优化算法,开展了血糖预测模型的构建与评估研究。
研究人员首先介绍了糖尿病的流行病学背景和血糖预测的重要性,指出传统的血糖预测方法在处理复杂的时间序列数据时存在局限性。为了克服这些局限,研究团队采用了三种机器学习算法——随机森林(Random Forest)、长短期记忆网络(LSTM)和门控循环单元(GRU)作为基线模型,并通过灰狼优化算法(Grey Wolf Optimization, GWO)对这些模型的超参数进行调优。随后,研究团队构建了一个XGBoost堆叠集成模型,将基线模型的预测结果作为输入,进一步提高了预测精度。
在方法部分,研究团队详细描述了数据集的来源和处理过程。DiaTrend数据集包含来自54名T1D患者的超过27,561天的CGM数据和8,220天的胰岛素泵数据4。为了捕捉时间序列数据的动态特性,研究团队生成了滞后特征,并将最近的胰岛素注射信息纳入模型。数据集被分为训练集和测试集,采用时间序列交叉验证方法以确保模型的泛化能力。
研究结果表明,GRU模型在基线模型中表现最佳,其MAE为13.31,RMSE为18.77,MARD为8.35。然而,XGBoost堆叠集成模型通过结合基线模型的预测结果,进一步降低了预测误差,其MAE为10.65,RMSE为14.59,MARD为6.98,显著优于单一基线模型。此外,研究团队还通过Clarke误差网格和Parkes误差网格分析了模型的临床相关性,结果显示超过90%的预测结果落在临床可接受的范围内。
讨论部分,研究团队指出,灰狼优化算法在提高模型性能方面发挥了关键作用。通过优化超参数,基线模型和堆叠集成模型的预测精度均得到了显著提升。此外,研究团队还强调了堆叠集成方法的优势,即通过结合多个模型的预测结果,可以有效降低单一模型的偏差和方差。尽管如此,研究也存在一些局限性,如数据集的性别比例偏高可能引入一定的偏差,且未考虑不同患者群体的差异性。
总体而言,这项研究表明,利用堆叠集成学习和灰狼优化算法可以显著提高1型糖尿病患者血糖预测的精度,为糖尿病管理和个性化治疗提供了新的工具和方法。研究结果不仅具有重要的学术价值,还具有潜在的临床应用前景,有助于开发更加精准和可靠的血糖监测设备,从而改善患者的生活质量。
生物通微信公众号
知名企业招聘