
-
生物通官微
陪你抓住生命科技
跳动的脉搏
构建英国选区级经济包容性数据集:揭示健康不平等与空间差异的关联机制
【字体: 大 中 小 】 时间:2025年07月16日 来源:Scientific Data 5.8
编辑推荐:
研究人员针对英国小区域经济包容性数据匮乏的问题,开发了SIPHER包容性经济(选区级)数据集。该研究整合行政统计与合成人口数据,构建包含13项指标的GB选区级(N=7,973)数据库(2019-2021),涵盖就业参与、财富不平等、住房负担等维度,并纳入SF-12心理健康(MCS)和生理健康(PCS)评分。验证表明该数据集与多重剥夺指数(IMD)具有良好相关性,为政策制定者提供识别健康不平等空间差异的新工具,相关成果发表于《Scientific Data》。
在经济复苏与公共卫生交织的时代背景下,英国各地持续存在的健康不平等现象引发广泛关注。研究表明,经济包容性(economic inclusion)与人口健康存在显著关联——那些在就业机会、收入分配和资源获取等方面处于劣势的社区,往往表现出更低的生命质量和更短的健康预期寿命。然而当前缺乏覆盖全英国(GB)的高分辨率空间数据集,能够系统量化这种关联。现有指标如多重剥夺指数(IMD)存在三大局限:各国计算方法不统一、更新周期不同步、侧重 deprivation(剥夺)而非 inclusion(包容),这使得跨区域政策效果评估如同"盲人摸象"。
来自利兹大学空间数据科学研究所(Institute for Spatial Data Science, University of Leeds)的Hugh P.Rice团队联合格拉斯哥大学等机构,在《Scientific Data》发表了开创性的选区级经济包容性数据集。这项研究创新性地采用混合数据策略:对就业参与率(1A)、体面工资比例(6A)等7项指标使用基于UKHLS(Understanding Society)调查构建的SIPHER合成人口;对房价收入比(4B)、数字连接性(2B)等5项指标采用政府开放数据;并通过Amelia II算法完成缺失值多重插补。最终形成的数据库覆盖英格兰、苏格兰和威尔士99.4%的选区(2022年边界),时间跨度为2019-2021年。
关键技术包括:(1)运用柔性建模框架(FMF)创建包含人口统计学约束的合成人口;(2)开发选区边界变迁映射算法处理历史数据;(3)采用Levenshtein距离匹配解决选举数据编码错误;(4)按GLA方法将LSOA级IMD数据聚合至选区级进行验证。特别值得注意的是,SF-12健康评分通过EU 2013标准人口进行年龄标准化,确保跨区域可比性。
研究将13个指标分为经济结果(A类)和促成因素(B类)两大维度。A类包含就业参与率(1A)、长期病患失业比例(2A)等7项指标,其中房价极值比(3A)通过LSOA级房价中位数计算得出。B类指标中,数字连接性(2B)采用CDRC的互联网用户分类数据,物理连接性(3B)整合了英格兰公交可达性指标与苏格兰SABI数据。验证显示教育指标(1B)与IMD教育域相关性最强(r>0.8),而住房负担指标(4B)在伦敦地区呈现独特分布模式。
与传统地方当局级数据相比,选区级数据(平均人口:英格兰8,236,苏格兰15,436,威尔士4,215)能揭示更精细的地理差异。如图3所示,在大曼彻斯特联合当局区域,就业参与率(1A)呈现中心-外围梯度分布;而格拉斯哥城市区的SF-12 PCS(生理健康)女性评分则显示出明显的社区聚集特征。

通过将选区级数据与地方当局级数据集对比,研究发现体面工资指标(6A)差异仅2-3%,验证了合成数据的可靠性。如图4所示,年龄标准化SF-12评分与IMD健康域显著相关,其中心理健康评分(MCS)在低收入选区普遍较低。

这项研究创建了首个覆盖全英国的高分辨率经济包容性数据集,其创新价值体现在三个方面:首先,通过合成人口技术解决了小区域数据稀疏性问题,使SF-12等健康指标能下探至选区级;其次,开发的指标映射方法实现了跨行政边界的数据可比性;最后,构建的交互式可视化平台(https://mapmaker.cdrc.ac.uk)支持政策制定者直观识别"热点区域"。正如作者强调,该数据集特别适用于评估后疫情时代复苏政策的空间公平性,例如分析"生活成本危机"对不同选区居民健康的差异化影响。未来研究可结合GALLANT项目,将环境可持续性指标纳入经济包容性评估框架。
生物通微信公众号
知名企业招聘