编辑推荐:
为探究老年医疗和日常护理服务需求影响因素并构建预测模型,研究人员经多方法研究,发现 LightGBM 模型最优,为相关决策提供参考。
### 老年护理需求预测:解锁精准养老新密码
在全球老龄化浪潮的席卷下,中国也未能 “幸免”。早在 20 世纪初,按照联合国《人口老龄化及其社会经济后果》的划分标准,中国就已迈入老龄化社会。时光流转,到了第七次人口普查时,60 岁及以上的老年人口已达 2.6402 亿,占总人口的 18.7% 。随着年龄的增长,老年群体中残疾、半残疾以及患慢性病的人数不断攀升,他们对医疗服务和日常护理服务的需求日益迫切。
医疗服务(Medical services)对于老年人来说,是维持健康的关键,涵盖了常规体检、疾病预防、诊断治疗、康复护理以及临终关怀等多个方面;日常护理服务(Daily care services)则致力于提升老年人的生活质量,包括协助日常生活活动、提供社会情感支持等。然而,当前的养老体系却面临着诸多困境。美国的长期护理系统虽有一定经验,但护理人员短缺问题严重;在中国,“4-2-1” 家庭结构让传统家庭养老模式不堪重负,机构养老成本高且供应不足,再加上老年人对家庭养老的偏爱,使得养老服务的供需矛盾愈发突出。
在此背景下,为了深入了解老年医疗和日常护理服务的需求,构建精准的预测模型,来自郑州大学、西北农林科技大学等机构的研究人员开展了一项意义非凡的研究。该研究成果发表在《Scientific Reports》上,为养老服务的优化提供了宝贵的参考。
研究方法:多管齐下,精准剖析
研究人员采用多阶段分层整群随机抽样的方法,在广州、苏州和青岛三个城市,对 1291 名 60 岁及以上的社区老年人进行了问卷调查,有效回收率高达 93.6%。问卷内容丰富,涵盖了老年人的人口统计学特征、家庭资源、社会经济状况、生活方式习惯、患慢性病情况以及对医疗和日常护理服务的需求等多个方面。
在数据处理阶段,研究人员首先对数据进行了预处理,保留缺失率不超过 30% 的特征,并采用均值插补法进行填充,同时剔除了上下 1% 的极端值。为了解决数据不平衡的问题,他们运用了合成少数过采样技术(SMOTE)和 TomekLinks 相结合的方法(SMOTE-TomekLink)对数据集进行重采样。
在构建预测模型<>
郑州大学、西北农林科技大学等机构的研究人员开展了此项研究。他们通过对广州、苏州、青岛三市 1291 名 60 岁及以上社区老年人进行问卷调查,获取了丰富的数据。在数据处理和模型构建过程中,运用了多种技术手段。
研究人员首先对收集到的数据进行预处理,包括特征选择和数据清洗。针对数据不平衡问题,采用 SMOTE-TomekLink 技术进行重采样,以平衡数据集。随后,利用随机森林(RF)、梯度提升决策树(GBDT)和轻量级梯度提升机(LightGBM)三种算法构建预测模型,并通过随机搜索和 10 折交叉验证优化模型,使用准确率(ACC)、召回率(R)等指标评估模型性能。
在研究结果方面,LightGBM 模型在医疗服务需求预测和日常护理服务需求预测中均展现出卓越性能。在医疗服务需求预测模型中,其 AUC 达到 0.910,F1 分数为 0.841;在日常护理服务需求预测模型中,AUC 为 0.906,F1 分数为 0.819 。
从特征重要性分析来看,在医疗服务需求预测中,慢性病数量、教育水平和经济来源是关键影响因素;在日常护理服务需求预测中,慢性病数量、教育水平、月收入和子女探望频率对需求影响显著。
这项研究意义重大。它成功构建了老年医疗和日常护理服务需求预测模型,明确了影响需求的关键因素,为政府制定养老政策、优化资源配置提供了科学依据。例如,政府可根据这些结果将弱势老年人服务需求纳入保障体系,加强基本医疗服务体系建设,推动医疗保险与养老服务融合等。尽管研究存在一定局限性,如无法反映数据时间序列变化、缺乏医学临床指标、模型算法选择有限等,但它为后续研究奠定了基础,指明了方向,对推动老年健康服务领域的发展具有重要的价值。