编辑推荐:
为探究社会经济因素对 COVID-19 病例的影响,研究人员分析美国各县数据,发现多因素与病例数相关,对防控有重要意义。
研究背景:COVID-19 疫情下的不平等困境
2020 年 3 月,世界卫生组织宣布 COVID-19 成为全球大流行病。自 2019 年 12 月疫情爆发后,迅速蔓延至 200 多个国家,美国更是重灾区之一,感染人数超 3000 万。令人惊讶的是,美国不同地区的疫情严重程度差异巨大,比如加利福尼亚州的特哈马县和伊利诺伊州的库克县,每 10 万人中的确诊病例数相差甚远。
众多研究表明,COVID-19 疫情对人们的社会经济状况产生了深远影响。但反过来,社会经济条件如何影响 COVID-19 病例数量,却尚未被充分研究。此前研究多使用综合指标衡量社会经济地位,难以精准剖析单个因素的作用,且很少关注宽带接入与病例数的关联。而宽带接入在疫情期间对工作、教育和获取健康信息至关重要,其在不同群体和地区的差异巨大,却未得到足够量化评估。因此,研究这些社会经济因素对 COVID-19 病例数的影响迫在眉睫。
美国明尼苏达州立大学(Metro State University)和得克萨斯州立大学(Texas State University)的研究人员 Aindrila Chakraborty 和 Jaymeen Shah,针对这一问题展开研究,成果发表在《Archives of Public Health》上。该研究旨在深入剖析社会经济因素与 COVID-19 病例数之间的关系,为疫情防控提供关键依据。
研究方法:多源数据融合与面板数据分析
研究人员为全面探究社会经济因素对 COVID-19 病例数的影响,收集了来自 10 个不同数据源的美国各县数据,涵盖 2020 年 3 月至 6 月期间。这些数据来源广泛,包括约翰斯?霍普金斯大学(Johns Hopkins University)、美国农业部食品环境地图集(USDA Food Environment Atlas)、人口普查局(Census Bureau)等。通过 SQL 和 Python 编程语言进行数据整合,构建了全面且信息丰富的数据集。
研究聚焦于四个关键社会经济因素:收入(以各县家庭收入中位数衡量)、教育(以 25 至 64 岁居民中未获得高中文凭或同等学历的比例划分低教育县和高教育县)、宽带接入(通过宽带使用和宽带速度衡量)和健康食物获取(通过不靠近杂货店的人口比例和农贸市场可用性衡量)。以约翰斯?霍普金斯大学每日报告的各县 COVID-19 确诊病例数据为基础,计算每周确诊病例率作为结果变量。同时,研究还纳入了 23 个县级层面的控制变量,涵盖社会经济因素、地理因素、健康行为、共病情况、临床护理、环境和人口特征等多个方面。
在统计分析时,由于数据集包含横截面(县)和时间(周)维度,研究人员采用基于面板数据的回归方法进行分析。运用最大似然(ML)估计程序,并使用 STATA 和 SAS Enterprise Guide 统计软件进行模型估计和检验。为确保研究结果的可靠性,还进行了一系列稳健性检验,包括模型选择(似然比检验对比固定效应和随机效应模型)以及检查异方差性、序列相关性和空间自相关性。
研究结果:多因素交织影响疫情态势
- 关键因素与 COVID-19 病例数的关联:研究发现,家庭收入中位数、教育水平和宽带下载速度与 COVID-19 感染病例数呈负相关。具体而言,家庭收入中位数、教育和宽带速度每增加 10%,COVID-19 病例数分别下降 0.00002、0.5 和 0.01 个百分点。而在获取健康食物方面,不靠近杂货店的人口比例与 COVID-19 病例数呈正相关,该比例每增加 10%,全县 COVID-19 病例数增加 6 个百分点。这表明在四个关键因素中,获取健康食物的难易程度与各县 COVID-19 病例数关联最为紧密。同时,宽带使用和农贸市场可用性与病例数的关联不显著。
- 扩展模型揭示的交互作用:扩展模型 1 加入了宽带变量(宽带使用和速度)与教育水平的交互项。结果显示,教育水平与宽带使用之间存在显著的负向交互作用,表明教育水平会影响宽带使用与病例数之间的关系。但教育水平与宽带下载速度的交互作用不显著。扩展模型 2 加入了快餐店支出变量以及其与不靠近杂货店人口比例和农贸市场可用性的交互项。结果表明,快餐店支出的主效应不显著,但它与不靠近杂货店人口比例的交互作用显著为正,意味着在获取健康食物困难的地区,快餐店支出的增加会加大 COVID-19 感染的可能性。
- 控制变量的影响:在控制变量方面,研究发现严重住房问题、身体不健康天数、过度饮酒、肥胖、糖尿病和 65 岁以上年龄组与县级 COVID-19 病例数显著正相关。这些因素从侧面反映出生活环境、健康行为和身体状况等方面对疫情传播的影响。
- 不同收入县的差异分析:研究人员通过 K-means 聚类算法,将各县按家庭收入中位数分为高、中、低三个收入组。分析发现,低收入县居民人均每年在快餐上的支出(615.77 美元)高于高收入县(588.40 美元)和中等收入县(575.70 美元)。进一步对比低收入县和高收入县发现,家庭收入中位数对两组县的感染病例数均有负面影响,但对低收入县影响更大;高收入县中教育水平与病例数显著负相关,而低收入县中教育水平的影响不显著;宽带使用对两组县均不显著,宽带下载速度在低收入县显著,在高收入县不显著,表明高收入县高速宽带更普及;不靠近杂货店的人口比例对低收入县影响显著,对高收入县不显著,农贸市场可用性对两组县均不显著。
研究结论与讨论:为抗疫策略提供关键指引
本研究通过对美国各县数据的深入分析,清晰地揭示了社会经济因素与 COVID-19 病例数之间的复杂关系。收入、教育、宽带接入和健康食物获取等因素,显著影响着人们在疫情期间的健康防护行为和感染风险。高收入、高教育水平、高速宽带接入以及良好的健康食物获取条件,有助于降低 COVID-19 病例数。
这一研究成果对公共卫生政策制定具有重要意义。公共政策应优先关注健康食物的供应,确保各县居民,尤其是低收入县居民能够方便、实惠地获取健康食物,提高人们的健康水平和免疫力。政府应致力于提升低收入地区的宽带速度,缩小数字鸿沟,使人们能够更便捷地获取健康信息,采取有效的防护措施。
然而,研究也存在一定局限性。例如,由于初期检测能力有限,研究中使用的各县确诊病例数可能无法准确反映实际情况。而且,研究中的解释变量由不同机构收集,数据年份不同,可能存在可改变的面积单元问题(MAUP)。尽管如此,该研究填补了公共卫生领域的重要空白,为后续研究提供了重要参考。在未来面对类似疫情时,研究成果可帮助卫生当局更合理地分配资源,制定更有效的防控策略,提升社会对疫情的应对能力。