《Scientific Reports》:Application of a novel approach for dementia prevalence prediction in Taiwan
编辑推荐:
本研究针对全球老龄化背景下痴呆患病率快速上升的公共卫生挑战,以台湾地区1998-2023年健保数据库的年度痴呆确诊数据为基础,提出了一种新型飞鹅优化算法(FGOA)优化的支持向量回归(SVR)模型FGOASVR。通过与ARIMA、HWETS、LSTM等8种传统及机器学习模型对比,FGOASVR在男女性别组分别取得平均MAPE 3.17%/3.42%和RMSE 0.69/0.96的最优预测精度,证实其能有效捕捉痴呆患病非线性趋势,为公共卫生资源规划提供可靠工具。
随着全球人口老龄化进程加速,痴呆症已成为席卷各国的"灰色海啸"。这种慢性神经退行性疾病不仅侵蚀患者的记忆、判断力和日常生活能力,更对家庭、医疗系统乃至社会经济造成巨大负担。世界卫生组织数据显示,全球痴呆患者已超过5500万,到2050年预计将突破1.39亿,年经济成本超过万亿美元。在老龄化程度突出的台湾地区,65岁以上人口占比超过17%,目前约有31万痴呆患者,预计2041年将突破50万大关。面对这场迫在眉睫的公共卫生危机,精准预测患病趋势成为制定防控策略的关键。
传统预测方法如自回归综合移动平均(ARIMA)和霍尔特-温特斯指数平滑(HWETS)虽被广泛应用,但其线性假设难以捕捉痴呆患病数据的复杂波动。而支持向量回归(SVR)虽能处理非线性关系,却对超参数配置极为敏感。为此,台湾成功大学团队在《Scientific Reports》发表最新研究,创新性地从大雁V形编队飞行现象中汲取灵感,开发出飞鹅优化算法(FGOA),并与SVR结合构建了FGOASVR预测模型。
研究团队利用台湾健保研究数据库(NHIRD)1998-2023年共26年的痴呆确诊数据,按性别和6个年龄组(60-64岁至85岁及以上)分层分析。通过模拟雁群协作的四大机制——团队协作(利用领航雁产生的上升气流提升群体效率)、相互鼓励(通过适应性激励因子调整搜索强度)、同伴支持(对落后个体实施定向辅助)和轮换领导(动态更换领航雁避免早熟收敛),FGOA能智能优化SVR的惩罚参数C、核宽度σ和ε不敏感损失参数。该方法在80%训练集上采用10折交叉验证,最终在2016-2023年测试集上与其他三类模型对比:统计模型(ARIMA、HWETS)、深度学习模型(LSTM)和混合模型(PSOSVR、DESVR等)。
4.3 不同方法预测痴呆病例数的比较
FGOASVR展现出全面优势。在男性组预测中,其平均MAPE(3.17%)和RMSE(0.69)显著低于传统ARIMA(6.90%,1.13)和LSTM(9.73%,1.39);在女性组预测中同样保持领先(MAPE 3.42%,RMSE 0.96)。特别在70-74岁女性组,DESVR和HHOSVR的MAPE分别高达37.07%和13.29%,而FGOASVR稳定在2.94%,体现出对数据异常波动极强的鲁棒性。
4.4 年龄组数据分析
模型在各年龄段的预测曲线与真实值高度吻合。以85岁以上群体为例,女性患病数从1998年的2.57万激增至2023年的68.17万,FGOASVR准确捕捉到2016年后的加速拐点,而ARIMA和HWETS则出现系统性偏差。这种优势在较年轻组(60-64岁)同样明显,说明模型能同步适应低基数平稳增长和高基数爆发式增长模式。
研究的创新点在于将生物群体智能行为转化为数学优化策略,首次验证了FGOA在公共卫生预测领域的适用性。相比粒子群优化(PSO)和鲸鱼优化算法(WOA)等传统智能优化算法,FGOA通过多机制协作有效平衡全局探索与局部开发,避免陷入局部最优。值得注意的是,尽管LSTM在85岁以上组表现良好(MAPE 4.15%),但其在年轻组波动较大,反映出深度学习模型对数据量和参数调校的敏感性。
当然研究也存在局限:基于台湾单一支付方医保数据的结果,其外推性需在不同医疗体系下验证;年度数据粒度可能掩盖季节性波动;未提供预测误差的置信区间也一定程度影响结果解读。但毫无疑问,这项研究为应对老龄化社会的健康挑战提供了重要方法论支持。随着算法进一步优化,FGOASVR框架有望扩展至其他慢性病预测领域,成为公共卫生决策的"智能导航仪"。
最终研究表明,融合群体智能的机器学习方法能显著提升痴呆趋势预测精度。在老龄化不可逆转的当下,这种数据驱动的预见性分析不仅能为医疗资源调配提供科学依据,更提醒我们:应对痴呆危机,需要像雁群一样——既要有领航者的远见,也离不开社会整体的协同支持。