综述:地球观测衍生贫困地图可解释性视角

【字体: 时间:2025年10月12日 来源:Science of Remote Sensing 5.2

编辑推荐:

  本文系统评述了EO4Poverty领域进展,指出当前基于黑箱模型(black-box)与原始影像的贫困地图虽在精度(70-90%)上表现优异,但存在可解释性不足、忽视时空动态与本地情境等问题。作者强调需融合可解释地理空间特征与领域专家知识,提升模型透明度与可操作性(operationalizability),以推动技术从概念验证(TRL4)迈向实际部署(TRL9),服务于SDG1(可持续发展目标1)贫困监测与政策决策。

  

1. 引言

地球观测用于贫困研究(‘EO4Poverty’)领域近年来逐渐兴起,旨在探索如何利用地球观测数据来估算和预测贫困。该领域的出现部分源于联合国所说的实现可持续发展目标(SDGs)所需的“数据革命”。然而,EO4Poverty技术及其对贫困概念化的缺陷与挑战尚未得到充分认识。
已有三篇近期综述探讨了EO数据在贫困制图中的应用,本文不再重复文献回顾,而是聚焦于文献中需要关注的趋势,以期EO贫困地图能从概念验证研究发展为政策实施中的真正工具。EO4Poverty模型可以且应当聚焦于可解释性、可操作性,同时兼顾准确性和鲁棒性,但近期出版物多关注后者。此外,模型不应假设地球观测与贫困之间的关系在空间和时间上是静态的。这些模型将受益于结合原始影像与可解释的地理空间特征,以及来自本地最终用户的领域专业知识,以确保可及性。
技术就绪水平(TRLs)用于评估产品的成熟度和市场适用性。这些级别有助于确保技术在最终广泛部署前经过适当性、鲁棒性检查和性能评估。TRL大致涵盖产品创造的三个主要领域:研究、开发和部署。迄今为止,大多数EO4Poverty工作表明,利用地球观测数据估算贫困处于或接近概念验证水平——即Lavin(2022)中的第4级。

1.1. 为何需要EO衍生的贫困地图?

鉴于当前调查和人口普查数据的不足,快速、频繁和精确的卫星数据大有可为。人口普查数据可用于估算多维贫困,但可用指标往往太少。此外,这些数据收集不频繁(通常十年一次),无法捕捉15年SDG周期内所需的变化。它们通常无法用于估算货币贫困,因为很少包含收入和消费数据。此外,人口普查之间的间隔意味着很难利用这些数据理解变化的驱动因素。
针对人口代表性样本的家庭调查提供了特定焦点领域的深入信息。它们比人口普查更频繁(通常每3-5年进行一次),但尽管比人口普查便宜,这些调查仍然成本高昂,增加调查次数将费用不菲。因此,传统调查的频率不太可能增加,这意味着在可预见的未来,大多数国家的数据缺口仍将存在。
利用地球观测数据绘制贫困地图的理论基础是,景观特征通常能反映社会经济状况,而这些数据可用于“看到”其中一些特征。因此,EO数据可用于创建代表这些特征的指标,这些指标可与当地贫困和福祉的各个方面进行统计关联,并随后用于预测贫困和/或福祉。
地球观测数据具有几个特点,使其适合为SDG1数据革命和贫困制图做出贡献:(1)相对而言,它们以标准格式覆盖全球大部分地区,并且可以相对容易地与传统调查数据连接/整合;(2)它们收集频繁,例如每日、每周或每月,有可能以成本效益高的方式填补传统调查之间的空白;(3)它们可以在没有数据的地区提供数据。因此,已有若干研究探讨如何利用地球观测数据估算肯尼亚和印度小区域的贫困和财富,以及斯里兰卡和孟加拉国的国家级模型。每项研究都能够将贫困度量与从地球观测数据衍生的代理指标或通过使用原始影像源联系起来。

2. EO如何用于贫困制图?

已有许多模型用于利用EO数据绘制贫困地图,包括线性模型、结构方程模型、基于树的方法、随机森林模型、增强的小区域估计和深度学习。我们承认这些模型在准确性、可解释性、鲁棒性和可用性方面各有其优势和局限性。在本视角中,我们关注的是EO数据在这些模型中的使用方式。我们认识到有两种截然不同的方式:第一种是使用可解释的特征,即对EO数据进行处理和分析,以创建一系列与贫困和财富相关的特定地面特征的代理指标;第二种是使用原始卫星影像直接输入模型。
当使用可解释的EO特征估算贫困时,卫星影像被转换为土地覆盖类别或其他感兴趣的变量,例如农田植被绿度的时间序列。这些数据使用村庄、城镇、县、区的边界与人类住区相关联。使用GIS,可以创建指标,例如聚落内不同土地覆盖类型的比例、农业生长期长度、建筑物数量、道路基础设施的类型和密度。这种方法的优点是可以检验特定EO变量的假设,然后进行描述和解释,从而建立对模型的信心。缺点是针对单个EO变量提供假设可能需要本地专家意见,并且意味着模型输出适用于较小区域。
最近,一些研究开始使用深度学习和原始影像,结合地球观测数据来绘制贫困地图,同时可能使用来自预训练深度模型嵌入的传统机器学习模型。这产生了易于下载和分析的、覆盖多个国家的网格化微观层面贫困数据输出。这些模型的贫困估算准确性可能令人信服,通常在70-90%的范围内。然而,像相对财富指数这样的多国模型被发现在特定地点给出不准确的估计。部分原因在于大型通用模型平滑了本地模式和情境。我们认为,如果这些模型要用于下游决策并纳入SDG报告仪表板,它们还需要是可解释的,即用户必须能够解释它们所显示的模式,因为对模式的解释是为政策响应提供信息所必需的。这些模型通常使用卷积神经网络或变换器架构来处理原始卫星影像瓦片以预测贫困指数。优点是可以直接处理原始卫星影像,而无需提取手工特征。缺点是很难理解影像的哪些方面导致了特定贫困值的决策。这种对贫困地图为何呈现特定样貌缺乏清晰度的情况,将限制其在政策和决策中的采纳,并阻碍技术向部署阶段发展。

3. EO4Poverty的雄心

EO4Poverty领域最近的两项发展对该技术是否为支持政策决策和SDG监测提供所需解释做好了准备提出了疑问。第一是利用地球观测和机器学习支持减贫措施的地理靶向,包括普惠现金转移计划。第二是在很少或没有数据发布的地区(如最近的朝鲜例子)使用地球观测和机器学习的兴趣。结合可持续发展解决方案网络提出的想法,EO4Poverty似乎正在出现三个关键雄心:
  • 支持减贫措施的地理靶向;
  • 提高财富和贫困更新频率以支持SDG1报告,使其能够提供年度更新;
  • 在数据贫乏的国家或地区提供贫困和财富估计。
我们就EO4Poverty领域如何向前发展以实现这些可敬的雄心提供了建议。我们特别关注结合黑箱机器学习方法与原始EO影像以提供微观层面(1-3公里分辨率的网格化数据输出)贫困估计的模型,而非中观层面(行政边界)估计,因为这些模型在文献中关注度最高,并且更广泛适用于更大区域,意味着它们可以达到TRL9部署水平。

4. 需要改变什么?

地球观测数据在贫困监测和决策中的使用很少见。要达到技术部署(第9级)需要一段从多个地点和使用一系列数据源收集证据的时期,以确定:
  • EO衍生的贫困地图预测的是什么?
  • 这些地图提供的是通用模式,还是考虑了本地情境?
  • EO4Poverty地图的哪些方面尚未被探索?

4.1. EO衍生的贫困地图预测的是什么?

贫困是多方面的。它可以涵盖健康、教育、更广泛的福祉、财富、资产、支出或收入等方面。如果我们要了解数据贫乏地区,或地理靶向扶贫计划,那么必须明确我们谈论的是哪种形式的贫困。例如,现金转移是扶贫政策,应使用准确识别特定贫困形式的可靠贫困统计数据来靶向。
地球观测指数衡量的是什么往往不清楚,因为诸如财富、福利、福祉和贫困等术语以多种方式使用,并且经常互换使用。不同形式的财富、福祉和贫困是相关的但又是不同的,它们的定义和衡量方式可能导致被归类为贫困的人群不同。财富可以衡量在相对较长时期内资产的历史获取情况。贫困是根据收入、饮食或消费来衡量的。人们可能在资产方面很富有,但在饮食或消费方面相对贫困,例如当家庭限制支出以投资于土地、房屋、教育或企业时。
家庭收入和支出调查不像衡量耐用家庭物品的调查那样广泛可用,因此大多数地球观测方法使用基于资产的财富指数而非贫困统计数据来训练模型。即便如此,资产指数对家庭的排序可能与基于消费的贫困度量不同。现金转移侧重于现金收入,因此,使用基于资产的财富指数来地理靶向现金贫困政策并非最优选择,这可能部分解释了为什么在印度尼西亚,当使用地球观测衍生的相对财富指数进行靶向时,理论上符合条件的现金转移计划接收者中有近三分之一被遗漏。如果一项政策靶向现金贫困,那么数据应衡量收入或支出贫困,而不是基于资产的财富,因为两者相关但不同,并且不可能使用财富或基于资产的数据集来为现金资源的分配辩护。

4.2. 地图提供的是通用模式,还是考虑了本地情境?

可能没有足够的训练数据来为单个国家生成使用机器学习的微观层面贫困地图。为了克服这一点,模型将多个国家合并到同一个训练集中。当应用于几十个国家时,模型有效地假设地球观测衍生指标与财富之间的关系是静态的,即地球观测特征或代理在空间和时间上与财富/贫困具有固定关系。然而,资产对人们并不具有普遍价值,同一资产对不同的人可能意味着不同的东西,因此仅仅识别资产的存在并不总能估算财富。最终,这意味着当产生多国模型时,本地情境常常被忽略。许多深度学习模型在从地球观测数据构建财富指数时采取了相对标准的方法,由此,从地球观测数据衍生的多个特征或潜在表示被统计组合成一个单一的指数值。例如,RWI使用2048维的潜在表示,通过PCA减少到约200个成分。当使用200个主成分作为预测因子时,很难识别(1)是什么驱动了模型输出,以及(2)本地情境是如何被考虑的。
在利用EO4Poverty探索数据贫乏地区时,理解空间多样性尤为重要。最近尝试使用地理空间数据估算朝鲜的经济发展,展示了EO4Poverty领域的一个关键优势。有些国家不能或不愿公开数据。地球观测数据具有独特优势,可以在不需要物理存在的情况下提供关于地方的信息(尽管如果没有任何地面数据与地球观测数据结合,这种信息是有限的)。通常,将一个地点开发的模型迁移到其他地方需要确定可比国家。但应该使用哪些指标来表明国家具有可比性?可以说,当考虑经济、社会、历史和气候因素的组合时,所有国家都会有所不同。但是否可以使用数以千计的原始影像变量以统计方式缩减后进行这种比较呢?
时间动态对于理解不同形式贫困及其原因至关重要。如果一个地区的动态发生变化,例如,主要经济活动从农业转变为工业,使用包含多年数据的原始影像变量的大型模型很可能会遗漏这一点。此外,这些模型的性能可能在短时间内(数月)恶化,并且它们在次国家单位的表现可能非常不均衡。为了改进结果,重点应放在开发能够解释贫困的本地驱动因素以及如何利用地球观测识别这些因素变化的方法上。
正如SDG报告要求所规定的,地球观测数据可以每年提供数据以支持SDG 1,但迄今为止,尚无研究检验从地球观测得出的估计值如何捕捉贫困或财富的年度变化。Kondmann和Zhu(2020)发现,常用于预测相对贫困的迁移学习方法能够使用单独的模型在卢旺达的两个固定时间点预测相对财富。然而,他们无法使用相同地区同期地球观测指标的变化来预测财富的变化。事实上,迁移学习模型预测了几个地区财富减少,尽管用于训练模型的家庭调查数据显示了相反的结果。作者认为,从地球观测中提取的特征变化缓慢,这意味着它们不能为模型提供足够强的信号。然而,该模型使用了空间分辨率为30米的Landsat 7数据,无法识别可能指示贫困的小尺度变化,例如建筑屋顶材料类型。
对EO4Poverty进行SDG1.1和1.2年度更新的进一步挑战是,迄今为止的大多数方法通过最大化用于预测的数据量来优先考虑准确性。这产生了一些令人信服的整体结果,范围在70%到90%之间,并产生了如RWI这样的产品。然而,这种方法首先假设地球观测与贫困之间的关系随时间不变。正如我们已经讨论过的,这是不合理的。其次,它要求数据(地球观测和家庭调查)在一致的时间获取。鉴于数据集通常在不同时间间隔收集,例如家庭调查可能跨越数月,而高分辨率卫星产品可能汇集多年数据,因此很难在使用包含不同时期(即地球观测、家庭调查、人口普查等)的各种数据集的同时,检验这些方法能否可靠地检测财富/贫困的细微年度变化。

5. EO4Poverty地图的哪些方面尚未被探索?

由于模型的黑箱性质以及许多模型中原始影像的使用,通常无法识别是哪些特征驱动了财富指数的预测。因此,这些模型目前的表述方式无法提供理解财富或贫困变化机制所需的透明度。除非实现这一点,该领域可能无法从TRL4——概念验证——继续前进。
解释模型输出是困难的,因为算法提取的“特征”既不可触摸,对潜在用户来说也难以理解。归根结底,贫困与在电磁谱红色部分检测到的辐射量(以此为例说明某些模型中使用的此类原始特征之一)没有直接关系。相反,它与实际获得农田的机会(以及土地保有权)、道路路面/获得服务的机会、农业生产力以及这些因素之间的相互作用有关。对这些地球观测驱动方法的信任需要透明和可解释的结果,而这在最近的一些论文中一直缺乏。
除了透明度,另一个需要考虑的关键方面是不确定性量化,特别是当模型被部署到其未经训练的区域时。与其返回一个区域的单一贫困值,不确定性估计提供了关于方法在预测这些值时的置信度信息。考虑模型的不确定性有助于最终用户判断是否应该信任并依据所产生的贫困值采取行动,特别是在将这些模型迁移到它们以前未见过的区域时。
我们的重点一直放在EO4Poverty的定量方面,而各种其他定性方面也会影响其可操作性和实践中的采纳,包括对这些工具缺乏认识,以及可能由此导致政策制定者缺乏信任。对此的详细讨论超出了本视角的范围,我们承认需要进一步研究探索促进这些工具安全融入决策所需的认识、可及性、专业知识、机会和问责制。

5.1. 使用TRL概念化对EO4Poverty的改进

地球观测驱动的贫困表征需要既准确又可解释。当前EO4Poverty建模方法的复杂性和不透明性使得政策制定者和非政府组织难以解释决策的基础,可能损害选民和捐助者的信任与支持。我们曾亲历联合国儿童基金会质疑贫困地图的生成方式,如果不提供可解释的模型特征,他们认为无法将其完全纳入操作流程。还存在使那些没有技术知识来挑战决策方式的人权利被剥夺的风险,特别是如果基于地球观测的监测方法与任何形式的自动化决策技术相结合。
对晦涩黑箱的依赖以及提供难以理解的变量作为解释,使得EO4Poverty的某些元素处于TRL 0级“基本原理”。这是因为如果不确定EO4Poverty的工作原理并通过确保模型可被解释,该技术不太可能被下游决策所接受。通过改进模型训练方式、重新思考使用这些模型预测贫困的层级(例如,在行政单位估算人口的中观层面模型与在网格层级估算人口的微观层面模型),以及更好地纳入领域知识和特定情境专业知识,可以解决输出更可靠和对其信任的问题。表1给出了一个理论示例,说明如何利用领域知识识别用于模型的地理空间数据并提供使用数据的理由。这是作者与利益相关者处理此事的方式。弄清楚这种领域知识如何能够被推广或不能推广,是EO4Poverty领域未来的一个关键问题,不应仅仅基于模型性能。迄今为止,只有一两次尝试使用领域知识来定义地球观测代理指标,并且两者空间范围都有限。提供用于生成贫困预测的地理空间变量描述以及它们的关系看起来如何(例如,预测生长期较长的地区更富裕),有助于将本地专家知识与建模方法联系起来,并将有助于建立下游用户的信心。这些关系可以通过各种线性和非线性模型(例如,基于树的模型)以及模型不可知的解释性工具(如Shapley分解或SHAP值)来探索。领域专业知识可用于识别特定地点贫困制图相关的地理空间指标。很可能从全球可用指标列表中筛选出一个子集,用于为贫困的特定方面创建代理指标。对这些代理指标如何与贫困相关联的解释也将受益于本地领域专业知识。
在可解释模型和纳入领域知识的基础上,可以使该技术整合到那些无法发布人口统计数据的地区或国家的下游决策中。这将使该技术达到TRL 6级“应用开发”,在该级别该方法可应用于特定用例,然后才能被“部署”(TRL 9级)。
Ahn(2023)关于朝鲜的研究提供了一个很好的案例,该模型结合了人类专业知识与在其他发布数据的国家训练的模型。在这个例子中,从人类专家那里获得了关于贫困或财富如何确定的特定领域知识。这些关于贫困/财富的叙述被用来识别地理空间数据集,作为本地决定因素的代理指标。我们认为这可能代表EO4Poverty从基本原理(1级)迈向概念验证(4级)及更高层次的一种方式,因为使用这些预测因子的模型对最终用户更可解释,因此更有可能被采纳。这是因为可以在贫困的决定因素和模型中使用的地理空间变量之间建立直接联系。如果模型没有产生预期的输出,可以与专家进一步探讨,或许可以确定如何对不同变量进行加权、以不同方式计算它们或寻找新的变量来替代。
将可解释特征与专家解释相结合的一个优点是,它将权力和控制权交还给具有最高TRL级别特征的地方专家手中。卫星的“全景凝视”创造了大量的机会,但伴随着这些机会的是使已经处于不利地位或边缘化的人进一步失去权利的风险。确保EO4Poverty方法情境化并可供挑战(尽可能由被代表者本人,不可能时由地区专家进行),是减轻被代表者对其生活被表征和治理的方式失去更多能动性风险的重要一步。然而,关于将表征贫困的权力集中在贫困直接发生情境之外的人手中是否公平或公正,仍然需要进行重要的对话。
对时空动态的理解有限使得许多EO4Poverty倡议处于TRL 2级“原理验证”。为了改进该领域,需要为特定年份开发模型,使用同期的家庭调查和地球观测数据,并重复多年以观察关系的一致性,并确立通过地球观测进行发展监测的有效性。该领域还需要确定地球观测数据能否以特定分辨率捕捉对财富和贫困不同方面具有信息量的特定指标,能否检测特定指标的变化,以及关键的是,这些指标是否与所研究当地人口的贫困或财富变化相关。这些模型最好本质上是动态的,以适应数据收集的不一致性,并允许地球观测与贫困之间的关系随时间变化。

6. 结论

EO4Poverty领域在从地球观测数据估算贫困和财富方面取得了巨大进展。已发表的若干数据驱动模型证明了地球观测确实可用于估算贫困和财富某些方面的概念验证。近期研究开始考虑如何将这些方法整合到下游决策中,为扶贫政策的地理靶向做出贡献。文献中还提出了利用该技术更新年度贫困和财富估计以及在未发布统计数据的国家提供财富估计的进一步雄心。这些雄心值得称赞,但当前的一系列方法存在一些局限性,需要克服这些局限性,地球观测数据才能被视为绘制和监测SDG1指标解决方案的一部分。模型需要更具可解释性,以便决策者理解贫困的驱动因素,根据本地情境信息做出决策,并为分配稀缺资源的选择提供理由。提高纯数据驱动模型容纳领域知识的能力,可能有助于巩固地球观测在可持续发展目标1数据革命中的作用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号