《People and Nature》:Geography of race and income shape spatial data gaps in two national participatory science projects
编辑推荐:
背景与需求:参与式项目(如eBird和iNaturalist)中,公众贡献地理参考生物多样性数据,是增强研究、管理和环境学习数据收集能力的常用工具。尽管有其效用,参与过程中的人口统计学差异、居住隔离的人口模式以及个体的参与选择可能导致数据偏差,影响研究结果、管
背景与需求:参与式项目(如eBird和iNaturalist)中,公众贡献地理参考生物多样性数据,是增强研究、管理和环境学习数据收集能力的常用工具。尽管有其效用,参与过程中的人口统计学差异、居住隔离的人口模式以及个体的参与选择可能导致数据偏差,影响研究结果、管理决策以及项目收益的分配。方法与途径:研究人员使用障碍模型(hurdle models)分析了2018年美国全境范围内eBird和iNaturalist志愿者观测事件的发生频率与丰度(n?=?9000万)与人口普查区(Census Tracts,每个区约1200–8000名居民)的种族构成和中位家庭收入水平之间的关系。研究人员分别对城市和农村区域运行模型,以考虑居住人口隔离的不同模式以及种族和收入群体相对于普查区大小的地理集中状况。主要结果:种族与收入的地理分布分别显著预测了eBird和iNaturalist的观测位置。在城市区域,eBird观测事件在以黑人、原住民和有色人种(BIPOC,Black Indigenous and People of Color)为主的普查区中显著更不容易出现,且丰度更低。在城市和农村区域,iNaturalist观测事件在以低收入居民为主的普查区中显著更不容易出现,且丰度更低。综合与应用:本分析明确检验了人员的地理分布是否与贡献性科学参与的地理分布相一致,强调社会空间过程如何同时塑造人口格局和数据覆盖。这种不均匀性可能扭曲科学推断,限制参与式科学在满足地方生态与环境管理需求方面的有效性,并导致收益分配不公。此外,数据较少的区域可能对参与者吸引力较低,并且/或者项目结构可能(无意中)将有色人种和低收入群体排除在外。如果类似模式出现在其他参与式项目中(美国有数千个此类项目),那么贡献性项目可能无意中创造出数据丰富和数据贫乏的区域。研究人员建议未来的研究按特定种族社区对参与数据进行分解,因为解决方案可能无法一刀切。
论文解读:种族与收入地理学如何塑造参与式科学项目中的空间数据空白
**研究背景与问题**
参与式科学项目,特别是公众贡献地理参考生物多样性数据的项目(如eBird和iNaturalist),已成为生态学、保护生物学和环境管理等领域不可或缺的数据来源。这些项目通过大规模、长时间尺度的数据收集,极大地扩展了科学研究的范围和能力。然而,尽管这些项目在科学产出和公众参与方面取得了显著成就,学者们对其是否真正具有包容性和公平性提出了质疑。在美国,eBird参与者中94.8%为白人,而iNaturalist也呈现出类似的参与偏差。同时,美国历史上深植的种族居住隔离政策(如红线划定)和收入分层,导致不同种族和收入群体在城市和农村空间上高度集中。这一社会空间过程可能不仅影响谁参与,还影响数据在哪里被收集。如果数据收集点系统性地偏向白人、高收入区域,那么这些数据将无法代表真实的地理覆盖,进而扭曲物种分布模型、误导保护投资,并加剧环境不公正。现有研究已指出公民科学数据存在空间偏差(与人口密度、社会经济状况等相关),但缺乏对种族和收入地理分布如何共同且分异地塑造数据空白的大规模、全国性分析。因此,本研究旨在直接检验:在美国范围内,eBird和iNaturalist的观测数据地理分布是否与种族和收入的地理格局相一致?城市与农村地区是否存在不同的模式?这种不均衡对科学研究和管理决策有何影响?
**研究内容、结论与意义**
研究人员利用2018年美国全境约9000万条eBird和iNaturalist观测记录,结合同年美国社区调查(ACS, American Community Survey)的人口普查区(Census Tracts)级种族与收入数据,运用两阶段障碍模型(hurdle model)分别分析了城市和农村地区中,观测事件发生概率和丰度与BIPOC(Black Indigenous and People of Color,黑人、原住民和有色人种)比例及中位家庭收入的关系。研究发现:在城市地区,以BIPOC为主的普查区显著更少出现eBird观测,且当存在观测时,数量也更少;iNaturalist观测则显著更少出现在低收入普查区。在农村地区,收入是两种项目观测存在与否的强预测因子,但种族的影响较弱且不一致。这一研究揭示了参与式科学数据的空间空白与社会空间不平等之间的深度耦合,以及这些空白如何可能无意中放大特权区域的可见性而忽视弱势区域。论文发表在《People and Nature》。
**关键技术与方法**
本研究依赖公开数据集,包括:从全球生物多样性信息机构(GBIF, Global Biodiversity Information Facility)下载的2018年美国全境eBird(约6600万观测)和iNaturalist(约170万观测)空间点数据;以及从美国社区调查(ACS, American Community Survey)获取的2018年人口普查区(Census Tracts,全国约73,056个区,每区约1200–8000人)级数据,包括非西班牙裔白人比例(其补集定义为BIPOC比例)和中位家庭收入。城市与农村分类基于人口密度阈值(每英亩1人)。核心统计方法为两阶段障碍模型:第一阶段使用二项式逻辑模型(binomial GLM with logit link)预测至少一个观测存在的概率;第二阶段使用零截断负二项模型(zero-truncated negative binomial model with log link)预测非零观测区的观测数量。模型分别对城市和农村普查区独立运行,以容纳两种空间格局的差异。所有分析在R环境中完成,使用'pscl'包。
**研究结果**
3.1 城市模型
在城市区域(约50,096个普查区,占美国人口约2/3),eBird和iNaturalist的观测分布均受种族和收入显著影响。针对eBird,零障碍模型显示BIPOC比例是显著负预测因子(Estimate = -2.74, p < 0.0001),即普查区中BIPOC比例越高,出现至少一条观测的概率越低(如全BIPOC区概率为28%,全白区为83%);收入是显著正预测因子(Estimate = 1.00, p < 0.0001)。计数模型同样显示BIPOC比例负预测(Estimate = -1.00, p < 0.0001),收入正预测(Estimate = 0.73, p < 0.0001),意味着即使在有观测的区域内,BIPOC比例高的区观测数量也更少。以巴尔的摩为例:5个以白人为主(72%)且高收入($107,000)的普查区共含超过11,000条eBird观测,而邻近5个以BIPOC为主(96%)且低收入($44,000)的普查区仅约400条观测。对于iNaturalist,零障碍模型中BIPOC比例负预测(Estimate = -0.33, p < 0.0001),收入正预测(Estimate = 1.50, p < 0.0001);计数模型中BIPOC比例和收入均为正预测。
3.2 农村模型
在农村区域(约22,960个普查区),eBird的零障碍模型中BIPOC比例不显著(p = 0.41),收入为显著正预测(Estimate = 3.69, p < 0.0001);计数模型中收入仍显著正预测(Estimate = 1.64, p < 0.0001),且BIPOC比例也呈正预测(Estimate = 0.49, p < 0.0001),但实际观测在极低收入区几乎为零,高收入白区观测量可达40,000条。iNaturalist在农村地区:零障碍模型中BIPOC比例为弱正预测(Estimate = 0.46, p < 0.001),收入为强正预测(Estimate = 2.32, p < 0.0001);计数模型中两者均为正预测(BIPOC: Estimate = 1.89; 收入: Estimate = 1.26),但高收入且高BIPOC比例的区存在最高观测量(约250–300条),而高收入但低BIPOC的区观测量更高(200–500条)。
**讨论与结论**
讨论部分提出两种非互斥的解释假说:(1)低吸引力假说(low attraction hypothesis)——以BIPOC和低收入为主的区域生物多样性较低,从而吸引更少观察者;(2)项目排斥假说(project exclusion hypothesis)——项目结构可能无意中排斥BIPOC和低收入个体参与。研究人员认为低吸引力假说不完全成立,因为观鸟者可能被非原始区域(如污水处理厂)吸引,且农村地区的生物多样性通常不低;而项目排斥假说更有力,因为参与率偏差(如eBird中BIPOC仅占5.2%而美国人口中占38.4%)表明项目存在结构性障碍。这些模式加剧了环境不公正:数据空白区域获得的投资和关注更少,而数据密集区域(通常是白人、高收入区)的生态价值被高估。研究结论部分翻译如下:第一,基于种族和收入的空间数据空白降低了数据质量,限制了项目预期用途。虽然整合互补数据集和统计技术可以部分校正采样偏差,但增加参与者多样性将直接改善数据空间分布。第二,代表性不均限制了科学惠及社会各群体的能力——如果历史被排除的群体不参与,研究议程和方法将仅反映主导文化,留下“未完成的科学”空白。第三,参与差异导致非正式科学学习收益不均,影响当地行动和倡导能力。最后,这些模式植根于美国白人至上主义文化及历史政策。未来研究应按特定种族社区(而非笼统的BIPOC)分解数据,因为解决方案因社区而异。