基于健康生态理论的中国社区老年人成功老龄化预测模型构建与验证
【字体:
大
中
小
】
时间:2025年10月14日
来源:Frontiers in Public Health 3.4
编辑推荐:
本综述基于健康生态理论,利用CHARLS数据库构建中国社区老年人成功老龄化(SA)预测模型。研究采用SHAP方法筛选关键变量,通过XGBoost等机器学习算法开发模型,其AUROC达0.78,判别斜率为0.140,Brier评分0.124,显示出优异的区分度、校准性和临床实用性(DCA验证)。该模型为社区老年健康管理提供了可解释、易推广的评估工具。
21世纪全球人口结构经历关键转型,人口老龄化进程加速。中国拥有世界上规模最庞大的老年群体,正面临这一挑战。截至2022年底,中国60岁及以上老年人口数量已达2.8004亿,占总人口比例的19.8%,这一数字不仅超越历史记录,更呈现出持续攀升的趋势。这一人口结构转变给国家的社会保障和医疗卫生体系带来巨大压力。需要特别指出的是,社区基层医疗卫生服务提供者作为公共卫生的前哨,在快速评估老年人群身心状况方面发挥着至关重要的作用。
成功老龄化(SA)的概念最初由Havighurst于1961年提出,后经Rowe和Kahn在1987年完善,成为评估个体和群体老龄化状态的关键指标。SA涵盖低水平的疾病与残疾、维持良好的认知与躯体功能以及积极的社会参与。随着老年人口增长,维持良好健康和社会参与的能力变得日益重要。评估社区居住老年人群中SA的流行情况对于主动应对人口老龄化至关重要。影响SA的因素复杂多样,Bronfenbrenner的健康生态理论强调了多个环境层面在塑造人类健康方面的复杂相互作用。该理论认为,社区老年人的健康状况并非孤立现象,而是嵌入在一个从微观到宏观层面的健康生态系统中。目前,世界卫生组织的积极老龄化模型强调健康、参与和安全是老龄化的支柱,这与本研究从生理、心理、认知和社会多维度界定SA的方法相一致。此外,Baltes的SOC模型聚焦于老龄化的适应性策略,可以从另一视角阐明本研究如何通过可测量的健康与生活方式因素来预测和干预SA,是对该模型的补充。
尽管将SA与机器学习相结合以评估老年人群的研究日益增多,但许多研究受限于模糊的理论框架和样本数据来源的约束。在开发具有广泛适用性、高区分度和显著临床效益的SA模型方面存在局限性。本研究旨在利用中国具有代表性的大规模横断面数据,探索适用于中国社区老年人群的SA预测因素。通过构建一个具有强可解释性、易于应用且具备在社区环境中广泛推广潜力的SA预测模型,旨在为社区老年人评估提供便捷工具,促进针对性干预措施的制定,提升社区老年人群的健康与福祉。
本研究采用横断面研究设计,数据来源于2020年进行的中国健康与养老追踪调查(CHARLS)第五轮数据。CHARLS是一项具有全国代表性的老龄化纵向研究,自2011年基线调查起每两年追踪一次参与者。这项综合调查收集了关于老年人健康状况、家庭结构、健康行为、收入、支出和政策等方面的大量详细信息。CHARLS调查(包括2020轮次)已获得北京大学生物医学研究伦理委员会批准,伦理批准号为IRB00001052-11015。
研究中,遵循联合国和世界卫生组织(WHO)的定义,将年龄≥60岁的个体界定为老年人。同时,利用CHARLS问卷中关于受访者居住状况的询问,以确认其是否居住于社区。
CHARLS2020的原始数据共包含19,395名受访者。因此,我们排除了年龄低于60岁、非社区居住的参与者,以及数据不完整(关键变量缺失值超过70%)的数据集。
最终分析中的变量集是通过在R Studio 4.1.2中使用“MICE”包进行插补后得到的。我们采用了“missForest”算法,这是一种多元迭代随机森林方法,迭代5次,每次迭代使用100个估计器。选择该方法是为了生成相对于原始数据集方差最小的插补数据集,确保后续分析的稳健性和可靠性。
数据清洗过程后,我们保留了4,324个合格样本纳入数据分析。其中,614名个体(14.20%)被识别为成功老龄化。
老龄化是一个影响生理、心理和社会功能的多方面过程。Rowe和Kahn提出了一个老龄化的概念模型,将老龄化描述为“正常”和“成功”。基于近期研究,SA的具体测量包括5项标准:“无重大疾病”、“无残疾”、“无抑郁”、“高认知功能”和“积极的社会参与”。本研究的结局变量为二分类变量,即无论社区老年人群是成功老龄化还是正常老龄化。
尽管特征数量在模型训练中至关重要,但需要认识到增加特征数量也会提升难度和相关成本。特征选择可用于减少或消除不相关或冗余的特征,从而简化最终模型并提高其效率。
基于健康生态理论,并利用中国基层医疗卫生工作者使用的社区居民健康记录,我们系统回顾了相关研究,以识别影响成功老龄化的潜在因素。健康生态理论模型由同心圆图示说明,从内到外依次为:个人特征、行为生活方式、人际网络、生活与工作条件、政策环境。
随后,我们进行了特征提取,并利用Shapley加性解释(SHAP)方法,根据实验结果计算了模型中最显著的30个特征。为了确定纳入模型训练的特征因素,我们观察了模型的AUC性能,并采用了重分类方法,同时考虑了不同的特征集。经过初级保健、护理和老年学专家的咨询,我们最终选定了16个能够指示中国社区内潜在SA的预测因子。SA的潜在预测因子包括健康生态理论概述的五个维度:个人特征、行为与生活方式、人际网络、生活与工作条件以及政策环境。
本研究采用三阶段方法进行模型开发:(1)机器学习模型构建;(2)模型评估;(3)模型解释。该研究方法的技术路线图进行了描绘。
在模型构建之前,67%的样本被指定为训练集,剩余的33%分配给验证集。
本研究中,我们结合XGBoost包使用了scikit-learn Python库进行模型构建和超参数微调。为确保数据一致可比,我们应用了线性函数归一化技术,具体将原始数据映射到[0,1]范围。该方法实现了比例缩放,有效减轻了数据特征间可能存在的维度偏差。
我们应用了六种机器学习方法,包括(1)逻辑回归(LR);(2)随机森林(RF);(3)轻量级梯度提升机(LGBM);(4)梯度提升决策树(GBDT);(5)K近邻(KNN);(6)极限梯度提升(XGBoost)。比较这些算法以评估它们在预测社区老年人SA方面的性能。
逻辑回归(LR)是一种广义线性模型,假设结果服从伯努利分布,由参数p(表示阳性结果的概率)参数化。在本研究中,阳性结果是指社区老年人SA的可能性。值得注意的是,逻辑回归对特征与样本的比例有严格要求,需要确保平衡以保证模型在不同人群中的泛化能力。研究中逻辑回归的参数设置为默认值。
随机森林(RF)是一种基于Bagging原理的集成方法,通过构建多个决策树来提升分类性能。每棵树抽取随机的样本子集和特征子集。最终分类由树间的多数投票决定。研究使用1,000棵树,默认设置,以评估模型预测SA的能力。RF算法的有效性归因于其bagging技术,通过聚合预测来减少方差并提高准确性。
轻量级梯度提升机(LGBM)是一种基于树学习算法的梯度提升框架。它强调两种关键技术:基于梯度的单边采样(GOSS),通过关注训练中具有显著梯度的数据来提高效率;以及互斥特征捆绑(EFB),通过捆绑互斥特征来简化特征空间。这些方法对于提升模型处理大规模数据和保持准确性的能力至关重要。
梯度提升决策树(GBDT)从单个决策树开始,迭代地添加树以修正前一轮树的错误。该模型使用基于梯度的方法来最大化每个分裂点的损失减少。采用正则化技术来防止过拟合,并通过控制树叶数量和深度的参数来管理模型复杂度。单个树的预测被汇总以得到最终预测,利用集成的集体智慧来减少方差并提高准确性。超参数调优(使用网格搜索交叉验证)对于通过平衡偏差和方差来实现最优GBDT模型性能至关重要。
K近邻(KNN)是一种用于分类任务的监督学习技术。KNN算法通过在特征空间中找到未标记数据点的‘K’个最近标记邻居,然后根据这些邻居的多数投票来分配类别标签。该过程依赖于三个关键方面:一组带标签的训练数据、用于测量数据点之间邻近度的距离度量、以及‘K’值的选择。该方法在生物医学中特别适用于模式识别和分类等任务,理解数据点的邻近性可以为数据内的复杂关系提供见解。
极限梯度提升(XGBoost)是一种以其在机器学习中的效率和可扩展性而闻名的梯度提升框架。XGBoost于2011年首次提出,通过梯度下降减少损失函数来优化预测模型。它因其将多个弱模型集成到一个高性能模型的能力而脱颖而出,这一过程提高了预测准确性并在不同数据集中具有良好的泛化能力。该算法的正则化特性也有助于防止过拟合。
为了提升XGBoost模型的分类性能,我们实施了80%交叉验证策略进行超参数优化。该过程侧重于微调关键超参数。通过迭代方法,我们确定了最有效的参数组合,随后将其整合到我们优化后的模型中。
我们对提出的模型进行了严格评估,利用一套指标来评估性能。这些指标包括准确度、精确度、灵敏度、特异度和F1值。计算这些指标的公式有详细说明。此外,我们纳入了受试者工作特征曲线下面积(AUC-ROC)作为关键指标,量化模型区分不同类别的能力。采用八折交叉验证方法来确认我们算法的稳健性。
为了增强模型预测能力评估的严谨性,我们纳入了决策曲线分析(DCA)。该方法使我们能够审视模型在一系列亚组中的判别能力和诊断精确度,从而实现对性能指标的细致比较和针对性优化。同时,我们绘制了校准曲线,以细致地将预测概率与实际结果对齐。这种可视化表示对于全面评估模型的一致性和准确性至关重要,确保我们的预测分析不仅在理论上表现良好,而且与实践中的经验数据相符。
SHAP方法作为一种解释个体预测和提供全局解释的技术。通过计算每个特征的贡献,它揭示了模型的决策过程,最终产生有意义的解释结果。SHAP摘要图和依赖图提供了可视化,说明了不同特征如何影响预测结果。在本研究中,采用SHAP算法来指示预测模型中特征的重要性。计算SHAP值以描绘输入因素与输出之间的关系,具体揭示了各种特征因素对社区老年人SA预测的贡献。
对所有研究变量进行了描述性统计分析。连续变量根据其分布,使用中位数(四分位距,IQR)或均值(标准差,SD)进行汇总。分类变量通过其类别内的比例进行描述。
非正态分布的连续变量和分类变量分别使用Kruskal-Wallis秩和检验和卡方检验进行比较。p < 0.05被认为具有统计学显著性。本研究中,使用Python脚本语言(v3.9.13)和R语言(v4.3.1)进行分析。
回顾性研究的数据处理阶段后,共收集了4,324份医疗记录,包括614名SA个体和3,710名非SA个体。人口分布包括2,207名男性(51.00%)和2,117名女性(49.00%),参与者中位年龄为67.6岁,由四分位距A-B描述。采用卡方检验来确定与SA显著相关的关键因素,结果详见表3。随后,在单变量回归分析中p值小于0.05的变量也被识别出来,并呈现在表3中。
研究中,患者以2:1的比例随机分配到训练集和测试集,以确保稳健的评估框架。训练集包含32个不同的特征,通过计算SHAP值来量化它们对模型预测准确性的个体贡献。对每个特征的贡献进行排名,此排名过程迭代了300次以确定结果的一致性和可靠性。然后我们统计了每个特征在这些迭代中出现在前30名的频率。最终的特征排名如图3A所示(由于空间限制,仅显示前30个特征)。我们还在图3B中阐明了每个特征对模型输出影响的分布情况。其中突出的因素包括生活满意度、居住面积、医疗保险、自评健康(SRH)、吸烟、教育水平、血脂异常、饮酒、居住地、性别、夜间睡眠时长、个人收入、年龄、体力活动和婚姻状况,所有这些因素在所有评估中都显示出显著的重要性。
为了优化模型的预测能力,我们采用了六种机器学习模型进行开发。对其性能指标的比较分析显示,KNN模型表现最差。相比之下,XGBoost模型表现出优于其他方法的性能,准确率达到82.82%,受试者工作特征曲线下面积(AUROC)为78.60%。每种机器学习模型性能的详细概览如图4所示。
在比较了各种机器学习模型后,我们选择XGBoost模型来构建社区老年人SA的预测模型。进一步对该模型进行了区分能力和一致性评估。
区分能力是衡量模型预测能力的关键指标,涉及模型区分社区内表现出SA个体的能力。我们通过AUROC和判别斜率评估了模型的判别能力和一致性,这是评估我们预测结果可靠性的关键基准。
一致性是指模型预测概率与实际发生概率之间的一致性,通过小提琴图进行可视化。同时,我们利用Brier评分和校准图对模型的一致性进行了详尽分析。为了加强研究的客观性和适用性,我们使用RF、LR和XGBoost构建的模型对区分度和一致性进行了深入评估。
图5A展示了模型的AUROC,显示XGBoost模型性能优于RF和LR。我们的模型获得了0.140的判别斜率。小提琴图表明模型在准确预测真阴性的同时,能维持真阳性风险分布稳定性(图5B)。校准图显示我们的模型预测与实际结果之间存在强一致性(图5C)。我们的模型Brier评分为0.124,低于0.25的阈值,表明在数据集内具有高预测准确性。
为了以符合临床决策的方式评估模型性能,我们采用决策曲线分析(DCA)来评估我们的模型在一系列临床场景中的“净获益”。“净获益”的概念涵盖了与假阳性和假阴性结果相关的利弊。
DCA的基本原理是在特定的临床决策阈值下测量预测模型的效用。我们研究中的预测模型在图6中展示了出色的临床净获益。
模型在不同人口亚组中表现出不同的性能(表4)。观察到性别差异极小,F1分数几乎相同(男性:0.484;女性:0.485)。与较年轻群体(年龄<70岁:F1=0.521,召回率=0.624)相比,模型在较年长老年人(年龄≥70岁:F1=0.418,召回率=0.457)中的性能下降,表明更高的假阴性率。出现了基于收入的显著差异,最高收入组实现了最优性能(F1=0.529),而最低收入组(F1=0.318)则表现出高假阳性率(精确度=0.182)。农村人口显示出稳健的结果(F1=0.597),而城市居民的召回率显著较低(0.436),表明对阳性病例的检测不足。
在本研究中,我们利用CHARLS 2020具有代表性的横断面数据,识别了中国社区老年人群中SA的预测因素。通过采用SHAP值和来自中国社区健康记录的变量,我们筛选了预测因子。随后,我们运用六种不同的机器学习模型构建预测模型。我们评估了模型的区分度、一致性和临床价值。我们的努力最终开发出了一个SA预测模型,该模型不仅具有强可解释性,而且有望易于应用并在社区环境中具有广泛效用。最终,构建了一个针对中国社区老年人的SA预测模型,具有强解释性、易应用和可推广的特点。
首先,我们采用了Rowe和Kahn广受认可的SA模型,涵盖生理、心理、认知和社会维度。先前的研究已利用各种机器学习模型构建SA预测模型,但由于缺乏统一的SA定义,导致模型异质性且可比性有限。我们的方法旨在通过利用综合数据集来增强模型的泛化能力和适用性,以解决这一问题。
Asghari Varzaneh等人对伊朗老年人横断面数据进行单因素回归以识别特征变量,最终开发了基于KNN的集成模型,准确率达93%,AUC为96.10%,显示出稳健的性能和区分度。类似地,Yazdani等人对伊朗老年人进行回顾性分析,采用主成分分析提取特征,并开发了基于模糊C均值的ANFIS模型,该模型融合了神经网络和模糊推理系统,显示出有前景的能力。然而,这两项研究都忽略了SA的心理维度,且其单中心、回顾性的性质限制了对模型在社区老年人群中预测性能的评估。
此外,Cai等人基于体能测试,利用南昌3,657名老年人3年随访数据开发了四种SA预测模型,其中深度学习模型表现出最佳预测性能(AUC 90.0%)。然而,依赖体能测试在实际社区应用中面临挑战,因为此类评估需要大量资源。
通过文献回顾,本研究开创性地使用具有代表性且高可信度的中国数据库构建社区老年人SA预测模型,为中国社区健康评估提供了宝贵工具。我们关注社区应用,这与先前关于ML模型可直接服务于临床实践的建议一致,具有提供SA预测服务的潜力,这对于主动应对人口老龄化至关重要。通过将预测模型嵌入电子病历并扩展至移动应用,我们增强了其在社区环境中的实用性。
在变量选择上,我们优先考虑临床可获变量,提高了模型在社区初级保健中的泛化能力。社区初级保健医生建立健康档案,评估老年人健康状况和生活质量,识别可改变的健康因素,从而能够提供更具针对性的医疗保健和疾病管理建议。我们基于健康生态学识别SA预测因子的方法有助于理解社区老年人个体SA的多维影响因素。
为了弥合模型开发与临床应用之间的差距,我们吸纳了近期关于ML在初级保健中部署的研究见解。这些工作强调了关键挑战——数据整合(例如,EHR与预测工具间的互操作性)、可扩展性(例如,使模型适应多样化的诊所工作流程)和临床医生接受度(例如,通过可解释性特征解决“黑箱”疑虑)——这些直接影响了我们的实施策略。本研究引入SHAP方法,通过评估不同变量的重要性和相互关系来增强模型可解释性,使新模型的判别路径和临床变量阈值与当前社区临床实践保持一致。我们的DCA表明模型具有良好的临床效益,提示其在初级保健场景中的重要性。
然而,我们的研究并非没有局限性。缺乏统一的SA概念和测量方法可能因地区和使用场景差异引入人群偏倚。数据库的限制导致无法纳入潜在的关键变量,且作为回顾性研究,数据缺失和输入错误不可避免。虽然本研究通过健康生态学和初级保健健康记录中特征变量的初步筛选提高了模型实用性,但在不同的初级保健场景中可能存在性能和区分度的差异,需要在未来研究中进行前瞻性验证。
我们的亚组分析揭示了模型在不同人口亚组间性能的重要差异,对临床实施具有重要启示。虽然模型展示了性别公平性,但在较年长老年人(≥70岁;召回率=0.457)、城市居民(召回率=0.436)和低收入人群(精确度=0.182)中准确性降低,反映了具有临床后果的不同错误模式。低收入群体中假阳性率升高可能导致不必要的干预,而较年长老年人和城市居民中较高的假阴性率可能延误关键护理——考虑到这些人群在医疗保健获取方面的挑战,这一点尤其令人担忧。这些发现强调了针对亚组进行特定模型校准的必要性,并突出了在现实世界老年护理环境中部署预测算法时需要考虑的关键伦理问题,即跨脆弱人群的公平性能。未来的迭代应优先考虑特征工程以解决这些已识别的差距,同时保持模型的整体预测效用。
未来研究将追踪CHARLS的定期随访结果,提取中国社区老年人的纵向数据,进一步优化SA预测模型,并将模型部署为在线资源,为社区医生和老年病学家提供更易使用的老年人健康评估工具。通过标准化应用程序接口将SA预测嵌入常规健康评估(例如,老年人年度体检),并将可改变的风险因素(例如,吸烟、缺乏体力活动)标记供临床医生审查。将对新患者数据(例如,2025年第三季度)进行前瞻性验证,并根据现实世界噪声调整指标(例如,针对类别不平衡使用AUPRC)。亚组特定阈值(例如,对老年人使用较低的概率截止值)和特征工程(例如,为城市居民添加社区层面变量)将在未来部署中减少偏倚。待未来CHARLS随访数据发布后,我们将积极参考开创性的纵向研究(例如美国的HRS和英国的ELSA),并将其方法、优势和局限性与我们自己的进行比较,以提高模型的跨文化和跨地区适用性。
在本研究中,我们利用CHARLS 2020数据和多种机器学习模型,开发了一种新颖的中国社区老年人成功老龄化预测模型,展示了出色的预测性能和临床净获益。该模型具有高度可解释性和泛化性,在社区初级卫生保健环境中具有显著效用。它为理解影响成功老龄化的因素提供了见解,并有助于医疗保健提供者制定针对性干预措施,以提升中国社区老年人的生活质量。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号