生成地理精细合成接触网络:揭示美国大都市区流行病结果差异的通用方法

《Epidemics》:Generating Geographically Detailed Synthetic Contact Networks: A Generalizable Approach with Applications to Epidemic Outcome Disparities

【字体: 时间:2026年02月21日 来源:Epidemics 2.4

编辑推荐:

  本研究所提出的GREASYPOP-CO方法,通过公开的普查数据构建地理精细的合成人口与接触网络,用以分析COVID-19等呼吸道病原体在人群中传播的结构性驱动因素。研究发现,即使在没有政策干预的情况下,合成人群的网络结构本身也会导致不同种族/族裔亚群以及不同社会经济地位地区的感染风险差异。研究进而模拟了工作场所和学校关闭政策,发现其会放大地理维度的感染风险差异,在某些城市中也会加剧种族/族裔间的风险差异。这些差异与家庭规模、与学龄儿童的接触以及就业行业的人口统计学和地理差异有关。这项工作为评估公共卫生干预措施、理解流行病学结果差异的根源提供了重要工具。

  
过去的历史性大流行常常放大了已有的社会经济健康不平等,而COVID-19大流行期间在美国,种族、族裔以及社区社会经济状况等方面的感染、住院和死亡率差异被详细记录。这些差异的根源是复杂的结构性社会不平等,但其中包括了感染率差异以及医疗保健获取和感染后结果的差异。将感染风险与其他因素(如检测率差异)分离开来十分困难,因此需要基于社会经济和地理数据的研究来阐明观察到的健康不平等的潜在根本原因,并理解干预措施对健康结果的影响,以制定更有效的策略来减少流行病带来的健康差异。
为解决这一问题,研究人员开展了一项关于如何从公共数据生成地理精细合成人口及其接触网络的研究,并应用该方法分析了政策干预如何塑造流行病学结果中的差异。他们提出了一个可适应且易于使用的方法,利用美国人口普查数据为选定的美国大都市区生成合成人口和关联的接触网络。该方法通过组合优化匹配人口特征,并整合了家庭、集体宿舍、学校和工作场所的信息来构建网络。随后,研究人员使用基于智能体的模拟来研究人口结构本身,以及类似大流行初期实施的工作场所和学校关闭政策,如何影响呼吸道病原体在人群中传播时不同种族、族裔和不同社会经济地位地区的感染风险差异。
研究人员发现,仅人口结构就导致了几乎所有研究大都市区中,西班牙裔黑人居民相对于非西班牙裔白人的更高感染风险,其相对风险峰值在某些城市超过1.4,家庭规模差异是重要驱动因素。在地理维度,基于地区剥夺指数的分析显示,较贫困地区的感染风险更高,这一现象在城市中心区域尤为明显。模拟工作场所和学校关闭政策后,所有城市都出现了更强的地理感染风险差异,并且在部分城市(如DC/Baltimore纽约市)中,种族/族裔间的风险差异也被放大了。这些结果说明,人口结构、社会经济因素和政策以情境依赖的方式相互作用,共同塑造了流行病学结果。该研究为理解健康不平等的结构性根源和评估干预措施的差异化影响提供了一个强大的、可推广的分析框架。
作者为开展本研究主要采用了以下关键技术方法:
  1. 1.
    基于组合优化和模拟退火的合成人口生成方法:利用美国社区调查的公开数据(包括普查区组汇总数据和公共使用微观数据样本),采用组合优化技术生成地理精细的合成家庭和个人,匹配目标区域的人口、家庭、种族、收入、行业等多维度特征。
  2. 2.
    多机构网络生成算法:在生成的家庭、集体宿舍、学校和工作场所内部,分别应用全连接瓦茨-斯特罗加茨小世界模型随机分块模型等算法,构建反映真实接触模式的接触网络,网络连接考虑了收入、年级等属性的同质性偏好。
  3. 3.
    基于智能体的疾病传播模拟:在生成的静态接触网络上,运行一个简化的基于智能体的传染病模型,模拟呼吸道病原体传播。模型定义了易感、暴露、感染、恢复四种状态,并设置了基于地点(家、工作/学校)和基于位置(人口普查区)的传播概率,以评估不同政策场景下的感染风险差异。

3. 结果

3.1. 人口特征与地理精度
生成的合成人口在关键人口统计学和经济特征上与美国普查数据匹配良好。所有大都市区的合成人口总数、种族、族裔、年龄、家庭规模等指标均与普查数据基本一致。与种族/族裔亚群相关的特征显示,在除费城外的所有人口中,按行业分类方法被归类为基本工人的西班牙裔个体比例高于非西班牙裔白人,黑人个体也大多如此。在所有人口中,从黑人或西班牙裔个体的视角来看,其家庭内的平均接触群体规模均大于非西班牙裔白人。从地理精度看,在除个体族裔(西班牙裔和白人非西班牙裔)外的大多数关键指标上,几乎所有的普查区组与普查数据的绝对误差都小于10个百分点,验证了合成人口在地理上的准确性。
3.2. 种族与族裔感染风险差异
基于接触网络的传播模拟测试显示,在大多数大都市区,即使没有政策干预,黑人和西班牙裔居民的感染风险也高于非西班牙裔白人。相对风险在模拟初期因感染在黑人和西班牙裔人口中传播更快而上升,随后随着易感人群减少而非西班牙裔白人开始“追赶”累计感染数,差异逐渐减小。关闭政策总体上减缓了传播,但倾向于让黑人和西班牙裔群体更多地暴露于风险中,导致了更晚且更高的峰值差异。如图2所示,除迈阿密外,西班牙裔的相对风险普遍高于黑人。关闭政策使得约一半大都市区的西班牙裔峰值风险差异被放大,并在DC/Baltimore纽约市都会区放大了黑人的峰值风险差异。从长期(第400天)风险差异看,除芝加哥和费城的黑人居民外,工作场所关闭在所有都会区都放大了差异。
3.3. 地理社会经济感染风险差异
基于居住地的社会经济地位分析发现,富裕社区(ADI ≤ 10)的感染风险倾向于低于较不富裕的社区(ADI在10至90之间),特别是在关闭政策下。在没有干预的情况下,DC-Baltimore、芝加哥和费城仅在市中心区域表现出地理差异。关闭政策则在所有测试的大都市区中都导致了地理感染风险差异。如图4所示,政策实施后,所有地区高风险(ADI > 10)与低风险(ADI ≤ 10)地区之间的峰值相对风险均高于无干预时。图3则以华盛顿特区为例,展示了基于ADI的感染风险地理分布地图。

4. 讨论与结论

本研究展示了一种根据现实人口的选定属性在精细地理尺度(普查区组)上生成合成人口的方法。该方法生成的合成人口与普查数据匹配良好,其构建的接触网络包含了影响接触模式的家庭构成、学校出勤和就业等信息。重要的是,模型中并未设定基于种族/族裔或社会经济地位的健康结果或风险差异,因此观察到的感染风险差异完全源于人际接触的数量和地理分布,以及社会经济地位与家庭内就业行业之间的相关性。
模拟结果显示,仅人口结构就造成了所有研究大都市区中种族/族裔间的感染率差异。其中,家庭规模很可能是驱动这些差异的主要结构性因素。在大多数人口中,西班牙裔个体的平均家庭接触群体规模最大;在洛杉矶,这一差异最为显著,西班牙裔的感染相对风险也是所有都会区中最高的。在迈阿密,黑人居民的家庭接触群体规模最大,其相对风险也最高。在地理社会经济维度,人口结构产生的感染率差异仅出现在某些地区,且在城市中心比郊区更为明显,家庭规模差异再次成为关键驱动因素。
关闭工作场所和学校的政策根据工人的就业行业改变了接触率,在所有大都市区都产生了基于邻里ADI的地理感染风险差异。这是因为富裕CBG居民中基本工人的比例较低。关闭政策对种族/族裔线的影响则更为复杂:模拟流行病增长阶段出现的峰值差异仅在部分大都市区有所增加,且对西班牙裔居民的影响大于黑人居民。由于同时模拟了关闭工作场所和学校,这种模式可能由基本工人的比例家庭内学龄儿童的平均数量之间的相互作用来解释。
研究并未试图将社会经济地位的影响与种族和族裔的影响分离开,在美国城市中,这些因素高度相关。尽管如此,模拟结果表明,人口结构差异(如家庭内工人和学龄儿童的数量)使特定种族/族裔群体更容易出现更快速的传播和更高的感染风险,而关闭工作场所的影响则更多地由工人的社会经济地位决定。
本研究强调,合成人口对于利用无法在真实人群中进行的实验来洞察复杂的因果关系系统具有重要价值。通过生成捕捉现实地点属性的地理精细人口,我们可以用人口特征来解释干预结果,并在精细尺度上绘制结果地图。这项研究开发的GREASYPOP-CO开源软件,可供研究人员和公共规划者使用,从美国普查数据生成人口和网络,并可扩展以包含所需的人口特征,为规划疫苗分发等干预措施,以及理解如何使干预措施适应地方社区提供了潜在工具。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号