
-
生物通官微
陪你抓住生命科技
跳动的脉搏
深度学习与统计模型在糖尿病负担预测中的较量:基于Transformer-VAE的创新框架与实证分析
【字体: 大 中 小 】 时间:2025年08月10日 来源:Scientific Reports 3.9
编辑推荐:
本研究针对糖尿病负担预测中数据质量与计算复杂度的双重挑战,创新性地将Transformer与变分自编码器(VAE)结合,系统比较了Transformer-VAE、LSTM、GRU和ARIMA模型的性能。结果表明Transformer-VAE在MAE(0.425)和RMSE(0.501)指标上显著优于传统模型(p<0.01),尤其在处理噪声和缺失数据时展现更强鲁棒性,为公共卫生决策提供了高精度预测工具。
糖尿病正以惊人的速度席卷全球,世界卫生组织预测到2030年它将成为第七大死亡原因,每年造成的经济损失将超过2.5万亿美元。面对这一严峻形势,传统的ARIMA等统计模型在捕捉糖尿病发展的复杂非线性关系时显得力不从心,而深度学习模型虽表现出色,却常受限于计算成本和数据质量问题。在这一背景下,设拉子理工大学计算机工程与信息技术系的研究团队在《Scientific Reports》发表了一项开创性研究,通过融合Transformer架构与变分自编码器(VAE),建立了糖尿病负担预测的新范式。
研究团队采用了四种代表性模型进行系统对比:创新的Transformer-VAE、经典的LSTM和GRU神经网络,以及作为基准的ARIMA统计模型。利用全球疾病负担(GBD)1990-2021年的年度数据,重点分析了残疾调整生命年(DALYs)、死亡率和患病率三大指标。研究特别设计了噪声注入和缺失数据模拟实验,通过MAE和RMSE指标量化性能,并采用ANOVA和Tukey检验进行统计验证。

模型性能方面,Transformer-VAE展现出压倒性优势。如图3所示,在DALYs预测中,其MAE(0.425)较LSTM降低32%,较ARIMA降低51%。图4显示的RMSE结果进一步证实了这一优势,特别是在处理长期依赖关系时,Transformer-VAE的误差波动显著小于其他模型。这种优势在高低收入国家的对比中尤为明显,如图5所示,模型能准确捕捉不同经济发展水平地区的疾病负担差异。

鲁棒性测试揭示了更深层的发现。如图7所示,当数据缺失率达到20%时,Transformer-VAE的误差增幅仅为12%,远低于LSTM(29%)和GRU(34%)。图6的残差分析则显示,在噪声干扰下Transformer-VAE保持稳定的预测能力,这得益于VAE模块的潜在空间表征学习能力。值得注意的是,如表3所示,模型在WHO外部数据集验证中MAE保持在0.581-0.632%之间,证实了其泛化能力。

然而研究也揭示了应用瓶颈。如图9所示,Transformer-VAE的训练时间是GRU的3.7倍,内存占用达4.2GB,这对资源有限的医疗机构构成挑战。相比之下,GRU展现出较好的计算效率,但其预测精度与LSTM的差异未达统计学显著水平(p>0.05)。
这项研究为糖尿病负担预测建立了新的技术标准。Transformer-VAE的创新之处在于:通过VAE的潜在变量z=zmean+exp(0.5·zlog_var)·ε处理数据缺失,结合Transformer的多头注意力机制捕捉长期依赖,实现了预测精度与鲁棒性的双重突破。研究不仅证实了深度学习在公共卫生预测中的优越性,更通过详实的收入分层分析,为差异化防控策略提供了数据支撑。未来研究可探索模型压缩技术和混合建模方法,以平衡计算成本与预测性能,推动AI在公共卫生领域的实际应用。
生物通微信公众号
知名企业招聘