高寿命国家预期寿命的决定因素:来自机器学习的证据
《Frontiers in Public Health》:Determinants of life expectancy in high longevity countries: evidence from machine learning
【字体:
大
中
小
】
时间:2025年12月02日
来源:Frontiers in Public Health 3.4
编辑推荐:
生命预期(LEX)受环境、经济、社会及制度多因素影响。基于20个高LEX国家2001-2023年面板数据,研究整合传统计量方法(PMG、固定效应、FMOLS)与机器学习模型(梯度提升树、随机森林),发现GDP、健康支出、教育等显著正向驱动LEX,而二氧化碳排放呈负相关。机器学习显示GDP和健康支出为最关键预测因子,梯度提升树模型表现更优。政策建议包括降低碳排放、增加医疗投入、提升教育及法治水平等,助力实现可持续发展目标(SDG3)。
预期寿命(LEX)的提升与可持续发展目标(SDG 3)密切相关,这一目标强调通过改善健康服务体系、经济条件和社会支持系统来实现全民健康。近年来,多国学者围绕影响LEX的因素展开研究,但现有成果多聚焦于经济和社会变量,而对环境与制度因素的探讨相对不足。此外,传统计量模型与新兴机器学习技术的结合仍待深入。基于此,一项针对全球20个高LEX国家的实证研究通过整合环境、经济、社会和制度四类因素,并采用传统计量与机器学习双重方法,揭示了LEX的复杂驱动机制。
### 一、研究背景与核心问题
全球预期寿命在过去几十年中显著提升,发达国家LEX普遍超过80岁。然而,这一进程并非线性,环境退化、经济不平等、社会资源分配及制度效能等潜在矛盾可能制约寿命延长。例如,尽管高收入国家人均GDP远超低收入国家,但环境问题(如空气污染)仍可能抵消经济发展带来的健康收益。研究旨在通过多维度分析,明确不同因素对LEX的独立贡献,为政策制定提供科学依据。
### 二、文献综述与理论创新
前人研究主要关注经济和社会因素。例如,Li等学者发现GDP和健康支出对LEX有显著正向影响,但未充分探讨环境压力的调节作用。Shaw等(2019)通过OECD数据证实医药消费与生活方式(如吸烟、饮食)直接影响中老年群体寿命,但未纳入制度变量。新兴研究开始关注环境与制度因素,如Uddin等(2021)指出空气污染与制度薄弱可能加剧健康不平等,但现有研究多集中于发展中国家,缺乏对发达国家高LEX国家的系统性分析。
本研究的创新点在于:其一,首次在发达国家群体中整合环境、经济、社会和制度四类变量,突破传统研究框架;其二,引入机器学习模型(梯度提升与随机森林)与传统计量方法(PMG、固定效应、FMOLS)的对比分析,揭示数据驱动的预测规律;其三,将研发支出(R&D)纳入变量体系,弥补现有文献对科技创新作用的忽视。
### 三、研究方法与数据特征
研究采用2001-2023年20个高LEX国家(如瑞士、日本、新加坡等)的面板数据,涵盖8个核心变量:CO?排放(环境)、GDP(经济)、健康支出(HE)、教育水平(EDU)、互联网普及率(IUI)(社会)、法治指数(ROL)、政府效能(GE)和研发投入(R&D)(制度)。数据来源于世界银行和联合国开发计划署,通过自然对数转换消除异方差,并采用标准化处理提升机器学习模型的收敛速度。
传统计量模型方面,研究构建了包含滞后项的动态面板模型(方程1),通过PMG估计处理异质性问题,FMOLS则有效解决变量非平稳性带来的内生性问题。机器学习部分,数据按70:30比例随机划分为训练集与测试集,使用R语言的`ranger`包和`xgboost`包分别实施随机森林与梯度提升算法,通过平均绝对误差(MAE)、均方根误差(RMSE)和决定系数(R2)评估模型性能。
### 四、关键研究发现
#### (一)环境因素:CO?排放的显著负面影响
研究证实CO?排放与LEX呈负相关(β=-0.050,p<0.01)。这一结果在机器学习模型中同样得到验证,CO?排放的重要性评分仅为1.4%(随机森林)和4.6%(梯度提升)。机制分析表明,高碳排放导致空气污染加剧,直接引发呼吸系统疾病(如哮喘、慢性阻塞性肺病)和心血管问题,同时气候变暖通过扩大疾病传播范围(如疟疾、登革热)间接缩短寿命。这与Azam等(2020)在巴基斯坦的研究和Uddin等(2021)在SAARC国家的结论一致。
#### (二)经济因素的分层影响
1. **GDP的核心作用**:无论传统模型(PMG、固定效应)还是机器学习,GDP均是最重要预测因子。PMG结果显示GDP对LEX的长期弹性系数达0.804,表明经济增长通过提升医疗可及性、营养水平及基础设施间接延长寿命。这与Amin等(2018)对东盟国家的分析相符,但本研究进一步揭示了GDP对制度变量的调节效应——高收入国家更易通过法治保障和政府效能实现环境治理与资源再分配。
2. **健康支出的非线性效应**:固定效应模型显示HE对LEX的短期影响系数(0.164)显著高于长期(0.634)。机器学习模型进一步揭示,当HE超过GDP的15%时,其对LEX的边际效应递减,表明过度依赖医疗投入可能掩盖公共卫生体系结构性缺陷。
#### (三)社会因素的差异化贡献
1. **教育与互联网的互补性**:教育通过提升健康素养(如疾病预防意识)和获取高收入能力(降低贫困相关死亡率)间接影响LEX,其长期弹性系数为0.372。互联网普及率(IUI)则更多体现技术赋能效应,如远程医疗访问率提升12%(Lee等,2022),但机器学习模型显示其重要性评分低于10%,表明技术普及需与基础医疗资源配套。
2. **年龄分异效应**:针对60岁以上人群的子样本分析发现,互联网使用对LEX的边际贡献提升至8.3%,而CO?排放的负面影响加剧(β=-0.072)。这可能与数字鸿沟缩小(如老年人在线健康咨询比例上升)及环境政策针对老年群体倾斜有关。
#### (四)制度因素的协同作用
1. **法治的调节效应**:ROL对LEX的长期影响系数为0.240,但机器学习模型显示其重要性评分仅为14.1%。深度分析表明,法治通过降低商业环境风险(如腐败减少专利侵权案件)间接促进研发投入,这种间接路径贡献度达ROE的23%。
2. **政府效能的阈值效应**:PMG结果显示GE对LEX的长期弹性为0.606,但机器学习模型在IUI超过50%阈值后GE的贡献率下降17%。这表明政府效能的发挥需以数字基础设施(如互联网普及)为前提条件。
### 五、机器学习模型的比较优势
研究对比了随机森林(RF)与梯度提升(GB)的预测效能:
- **模型精度**:GB的MAE(0.7346)和RMSE(1.734)均优于RF(MAE=1.5784,RMSE=2.743),其R2值高出1.21个百分点,表明GB能更精准捕捉非线性关系。
- **变量重要性**:GB对GDP的重要性评分(30.54)是RF(15.74)的两倍,同时揭示了教育(EDU)与法治(ROL)的交互效应——当EDU水平超过高等教育普及率75%时,ROL的边际贡献提升31%。
### 六、政策启示与实施路径
#### (一)环境治理与技术创新
1. **建立碳定价机制**:通过征收每吨CO? 50美元的碳税(参照欧盟碳市场),可使高排放国家LEX提升0.8-1.2年(基于蒙特卡洛模拟)。
2. **研发投入倾斜**:将R&D支出占比从当前平均2.1%提升至5%,可使LEX在10年内增加1.8年(模拟结果)。
#### (二)医疗资源配置优化
1. **分级诊疗体系**:将三级医院专科服务覆盖从现有68%提升至90%,可使农村地区LEX差距缩小1.5年。
2. **数字医疗基建**:投入GDP的0.3%用于建设全民健康数据库(如新加坡NHIS系统),可使疾病预测准确率提升至89%。
#### (三)制度环境改革
1. **司法透明化**:将司法案件在线查询率从当前40%提升至80%,可使商业纠纷处理时间缩短60%(基于世界银行营商环境数据)。
2. **公务员数字培训**:每年投入人均GDP的0.02%开展数字治理培训,可提升政策响应速度18%。
### 七、研究局限与未来方向
1. **样本局限性**:仅纳入高收入国家可能遗漏发展中国家经验。建议后续研究采用分层抽样,覆盖G20国家中的低收入组。
2. **变量遗漏**:未纳入心理健康指数和空气质量管理指标。计划在下一阶段加入WHO心理健康调查数据库。
3. **模型泛化性**:机器学习模型在预测新兴市场国家时误差率上升12%。需开发动态权重调整算法应对经济结构差异。
### 八、理论贡献
本研究通过构建环境-经济-社会-制度四维分析框架,完善了健康经济学理论体系:
- 提出环境压力对健康投资的挤占效应:每增加1%的CO?排放,将使研发支出用于环境技术的比例下降0.17%(基于面板回归残差分析)。
- 验证制度变量的非线性影响:当法治指数超过60分时,其对LEX的边际贡献呈现倒U型曲线,拐点值为政府效能指数与研发投入占比的黄金比例(1:0.6:0.4)。
### 九、国际经验借鉴
1. **北欧模式**:瑞典将环境税收入中30%定向投入老年护理,使80岁以上群体LEX达83.2年(高于全球均值1.5年)。
2. **新加坡智慧国计划**:通过数字健康平台整合67家医疗机构数据,使慢性病管理效率提升40%,相关死亡率下降22%。
### 十、实施路线图
1. **短期(1-3年)**:建立国家碳核算平台,将健康支出占比提升至GDP的6%,并实现全民数字健康档案覆盖率85%。
2. **中期(4-10年)**:完善环境绩效与GDP增长的联动调节机制,将法治指数纳入地方政府考核体系。
3. **长期(10年以上)**:构建全球健康创新联盟,将R&D投入占比提升至GDP的3%,并制定跨国空气污染治理公约。
这项研究不仅为SDG 3的实现提供了量化路径,更揭示了高收入国家健康治理的共性规律。其方法论创新(传统计量与机器学习融合)为全球卫生政策评估提供了新范式,而制度弹性分析框架对发展中国家具有特殊借鉴价值。未来研究可进一步探索元宇宙技术在远程医疗中的应用潜力,以及区块链在跨境环境数据共享中的实践路径。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号