《Food Security》:Inside the crowd: Assessing the suitability of SMS-based surveys to monitor the food security situation in Uganda
编辑推荐:
基于SMS(Short Message Service,短消息服务)的调查作为一种快速、低成本的手段,正日益被广泛用于早期预警系统中监测粮食安全状况。然而,此类调查存在产生偏差结果的风险,例如源于选择偏差、损耗偏差或无应答偏差。为在考虑到这些潜在偏差的情况下评
基于SMS(Short Message Service,短消息服务)的调查作为一种快速、低成本的手段,正日益被广泛用于早期预警系统中监测粮食安全状况。然而,此类调查存在产生偏差结果的风险,例如源于选择偏差、损耗偏差或无应答偏差。为在考虑到这些潜在偏差的情况下评估基于SMS的调查对粮食安全监测的适用性,研究人员在乌干达全境对2000名受访者开展了为期一年的月度调查,并采用过滤方法来确保样本具有代表性。研究人员通过将调查回复与研究人员自身开展的面对面(face-to-face)家庭调查的高频数据以及外部收集的电话调查数据进行三角验证(triangulation),来评估数据的可能准确性。分析表明,基于SMS的调查可作为测量粮食安全状况随时间变化的 promising工具,但在测量实际粮食安全状况方面表现相对较差。与一般粮食安全状况相关的回复(而非膳食多样性、食物消费或市场价格相关的回复)被证明是最可靠的指标。为研究选择偏差对结果的影响,研究人员使用了不同情景,对样本构成与规模进行变动。结果显示,即使存在偏差的样本(例如在性别、地理位置或年龄方面存在偏差)也能显示出可比的趋势,但要获得准确结果仍需要最低样本量。
该研究发表于《Food Security》,研究背景方面,2007/2008年和2011年全球粮食危机促使大量资金与技术投入国家及全球粮食供需监测,以早期侦测粮食紧急情况。联合国粮农组织(FAO)与世界粮食计划署(WFP)在早期预警系统中使用遥感信息与粮食价格数据来发现异常,但这些系统面临数据准确性、可用性和时效性问题:在低收入国家,食品通胀数据可能被政治化而向下偏差,价格数据在偏远和冲突地区常缺失,且FAO全球信息与粮食安全早期预警系统(GIEWS)与WFP脆弱性分析与制图(VAM)存在价格数据收集与发布的时滞;遥感早期预警虽能部分克服上述缺陷,但仅反映粮食供应预测这一单一指标,无法涵盖粮食进口弥补生产短缺等实际情况。移动通信在偏远地区的普及为快速收集粮食安全数据提供了新机会,WFP开发的移动脆弱性分析与制图(mVAM)工具已在多国使用SMS、交互式语音应答(IVR)与计算机辅助电话访谈(CATI)开展月度短调查收集消费、应对策略与价格数据。但基于手机的 survey 存在若干突出问题:手机持有与使用以及调查参与倾向于年轻人、男性、受教育程度更高、城市与较富裕群体,会导致选择偏差、损耗(attrition)与周期性无应答偏差,使数据难以代表最易受粮食不安全影响的群体;无访谈员则无法通过观察核验回复、收集额外背景数据,回复准确性存疑;此外还存在面板条件作用(panel conditioning)等潜在问题。现有文献虽识别了这些局限,但缺乏系统性量化研究与应对方案,因此研究人员开展此项研究,通过在乌干达实施一年月度SMS调查并采用系统人口统计过滤保障代表性,再与面对面高频面板调查(HFPS)及乌干达统计局(UBOS)的高频电话调查(HFTS)三角比对,评估SMS调查数据的准确性,并通过多情景模拟分析样本特征与规模对结果的影响,以明确SMS调查在粮食安全监测中的适用边界与条件。
为开展研究,研究人员使用的主要关键技术方法包括:数据收集上,采用GeoPoll的双向SMS系统实施每月13问的SMS调查(2020年2月至2021年4月,目标每轮2000人),问题含封闭式单选、多选与简单数值回复,涵盖膳食多样性得分(DDS)、市场粮食可得性变化(Food Market)、家庭食物消费水平变化(Food Consumption)、家庭粮食状况(Food Situation)四类粮食安全指标;样本控制上,在调查抽取阶段系统应用过滤(filtering)方法限定收入阈值(农村≤753000乌干达先令/月,城市≤1,130,000乌干达先令/月)、地域(排除大都市区,各区自认农村回复占比≥75%)、性别(男/女各50%)、按乌干达人口统计确定七个子区域配额与权重,以规避常规SMS调查偏向城市、男性、高收入群体的选择偏差;对比数据源上,同步开展面对面高频面板调查(HFPS,与Makerere大学合作,四轮与SMS重叠:2020年6月、2020年8–9月、2020年12月、2021年4月,由家庭看护人回答相同粮食安全题)并使用UBOS的高频电话调查(HFTS,基于乌干达国家面板调查住户,CATI模式,报告粮食不安全体验量表FIES);分析方法上,用t检验与F检验比较均值与方差,用多元线性回归(OLS)与泊松回归(Poisson)检验粮食安全状态与社会经济、空间变量的关系,用χ2检验比较系数相等性,用控制变量后的各轮平均差异分析时间趋势,检查不随时变变量(性别、地区、年龄、城乡)的回复准确性与跨粮食安全问题的回复一致性(可靠性),并构建八类情景(情景1按2019/2020乌干达国家家庭调查UNHS加权模拟全国代表性样本;情景2取前500名早回复者模拟未过滤样本;情景3按Lau等2018年GeoPoll调查性别年龄权重加权;情景4–6分别按城乡、年龄组、性别比较子群回复;情景7比较重复受访面板与单次受访者、全样本以检验面板条件作用;情景8从全样本随机抽取20、50、200、500、1000户/轮评估最小样本量),全部分析用Stata 16完成。样本队列来源为:SMS调查来自GeoPoll手机号库与运营商名单新建/重访面板(乌干达全国过滤后目标2000人/月);HFPS为乌干达本土与合作校际协同当面调查队列;UBOS HFTS为UBOS国家面板中留有电话且2020年6月可接通的住户。
研究结果如下:
4.1 粮食安全状况水平(Food security status level):研究人员比较SMS调查与HFPS、UBOS HFTS在重叠时段与区域内的回复均值差、标准差比,结果显示均值相等原假设均被拒绝,方差相等原假设在三个情形下也被拒绝。分区域(以东部区为例)与分时期的均值差t检验表明,DDS(膳食多样性得分)、Food Market(市场粮食)、Food Price在各区域各时期均存在统计显著的SMS与HFPS均值差异;Food Consumption(食物消费)约半数时期存在显著差异;而Food Situation(粮食状况)多数均值差不显著。DDS均值差偏大,说明SMS调查系统性低估膳食多样性。
4.2 家庭特征与粮食安全状况(Household characteristics and Food security status):选取DDS与Food Situation两个指标回归分析,除性别变量外,SMS与HFPS的其他社会经济驱动因素(年龄、家庭规模等)系数符号相同且无统计显著的跨模型系数差异。年龄与家庭规模均呈二次关系:粮食安全随年龄改善但增速递减;Food Situation随家庭规模恶化(减速递减),DDS随家庭规模上升(减速递减)。性别在HFPS回归中不显著,但SMS中女性回复的Food Situation更好、DDS更高。
4.3 粮食安全状况的时间变异(Temporal variations in food security status):以各轮相对于2020年6月(基准)的控制变量调整后均值差异比较,Food Situation在SMS与HFPS间无统计显著差异,DDS仅在2020年12月有显著差异。两数据集均显示Food Situation粮食不安全最高在2020年6月(乌干达首轮全国封锁后),最低在2021年4月,2020年8–9月、12月、2021年4月间变异较小;DDS峰值在两数据中均为2020年6月,最低值为HFPS的2020年12月与SMS的2020年8–9月。与UBOS HFTS的中重度粮食不安全(FIES)趋势比,SMS的“差或极差Food Situation”占比趋势相似(2020年6月最高,其后下降),但HFTS恢复速度更快;DDS曾暗示2020年4月后不安全上升,与HFTS趋势矛盾,进一步显示DDS在SMS中可靠性低。
4.4 SMS调查中的测量误差(Measurement error in the SMS survey):不随时变的属性回复准确率(跨波次不变量)为:城乡定位最高误答8.6%,年龄5.6%,地区5.3%,性别2.9%,总体>90%。跨粮食安全指标一致性检验显示,仅约1%受访者称Food Situation差/极差但同时给出市场粮食可得改善与家庭食物消费改善的双正面回复;单独看Food Market或Food Consumption的不一致占比较高,但理论上市场/消费改善可与主观差状况并存,因而可靠性尚可。
4.5 样本构成变动情景(Scenarios for changes in sample composition):情景1(按UNHS加权模拟全国代表性)、情景2(前500早回未过滤)、情景3(按Lau等2018年龄性别加权)下,条件预测的“差Food Situation”流行率与全样本趋势几乎无差异;情景4(城乡子群)、情景5(年龄子群)、情景6(性别子群)显示子群间水平有差但时间趋势相似(城乡、25–34岁青年粮食状况更差,男女趋势与水平几乎同)。情景7比较全样本、重复受访者子群、单次受访者子群,回归系数无显著差异,面板与单次群体时间变异一致,未发现明显面板条件作用(但因重复受访量偏小,结论有限)。情景8随机抽不同样本量发现,每轮<200户时趋势接近随机,500户/轮趋势近似全样本,但每轮需至少约1000户才能对各轮估计精度足够(95%置信区间窄);按Cochran公式对无限总体边误0.03对应458,0.02对应1029,故建议样本规模介于458–1029。
讨论部分总结:研究人员指出,本研究通过三角验证比对SMS调查与面对面、外部电话调查数据,增补了既有SMS文献多只关注样本特征与回复率而少评估结果准确性的不足;四指标中Food Situation(一般家庭粮食状况)最可靠,DDS(膳食多样性得分)因多选复杂度与对象非家庭饮食决策者导致SMS低估严重,Food Market与Food Consumption可靠性中等;SMS数据在反映粮食安全随时间变化趋势上较准,但绝对水平估计偏差较大,故适合早期预警系统实时监测变动以触发详评与靶向行动,而不适合直接测度实际绝对不安全水平。研究采用调查抽取阶段系统过滤(收入、城乡、性别、区域配额)加参与激励(话费)来降低选择、损耗、无应答偏差,而非事后加权;即便如此,模拟显示即使存在性别、城乡、年龄偏差的样本,时间趋势仍与代表性样本相似,加权模拟(情景1、3)或未过滤早回样本(情景2)的趋势也与全样本无实质差异,城乡、年龄子群水平不同但趋势同,性别几乎无差,面板与非面板趋势同,说明若目标是监测趋势而非绝对水平,样本构成要求可放宽。但仍需最低样本量(乌干达情境下约500–1000/轮)保障趋势精度。研究局限包括:SMS题数受限难以收更多社会经济协变量;过滤配额致部分地区完成慢、轮间隔不均;仅英与卢干达语可能排挤其他语言群体;调查期覆盖Covid-19疫情与管制,可能影响粮食状况但与SMS方法无关。今后可配基线详调以补协变量,放松过滤提速降本,增加语种,并在非危机常态下复现验证。
结论部分原文翻译:本研究旨在评估采用基于SMS的调查 crowdsourcing公众信息以监测乌干达粮食安全状况的适用性。具体而言,研究人员检验了历时一年按月收集的数据多大程度上反映全国粮食安全状况变化,并探究样本代表性与规模如何影响结果。研究增补了既有SMS数据收集文献,不只关注样本特征与回复率,而是评估结果可能的准确性:通过将SMS数据与另两项调查比对,使用不同粮食安全指标(膳食多样性、市场粮食可得、食物消费、粮食状况)来确定最可靠的量度(针对实际值与随时间变化)。四项指标中,家庭一般粮食状况(Food Situation)似为最可靠量度;膳食多样性得分(DDS)结果最差,可能源于多选复杂度且调查对象为普通人群而非家庭饮食决策者。就一般粮食状况而言,SMS数据在揭示随时间变化上比绝对估计更可靠;与UBOS数据比对显示相似时间趋势,但SMS的粮食不安全估计值普遍更高。因此SMS调查可作为粮食安全早期预警系统的合适工具,聚焦实时监测粮食状况变化以发现变动、触发详细评估与靶向行动。与多数文献事后加权不同,研究人员在收集阶段系统应用过滤以避免SMS样本常见选择偏差(男性、城市、高收入偏多),并提供参与激励(话费)以降低选择、损耗与周期无应答偏差;大样本使其能用情景模拟文献中各类偏差以评估对结果的影响。对样本加权以模拟全国代表性或文献中偏差,未实质改变关于粮食状况随时间回复的结果;重复与单次受访者结果可比;男女回复均值与趋势几乎相同;城乡与年龄组趋势相似但农村与25–34岁青年粮食状况更差。这些发现意味着,若早期预警系统关注变动趋势而非绝对值,样本构成重要性较低:测试情景结果与全国代表性调查(他人通过加权模拟)以及Lau等2018未过滤GeoPoll样本结果广泛一致;也不需要面板数据。但仍需最低样本量(乌干达案例约500–1000)获可靠结果。若需实际粮食安全绝对状况信息,抽样策略应确保足够多农村与多年龄组受访者。研究局限指向未来方向:SMS题量限制协变量收集,可配基线详访补取;过滤拖慢部分地区致轮间隔不均,未来可适度放宽提效降本;应增语种减语言偏差;调查恰处Covid-19暴发期,后续可研管制影响。