综述:餐饮服务中推动减少肉类消费的助推干预措施?一项基于实地干预研究识别调节因素的系统回顾和荟萃分析
《Journal of Environmental Psychology》:Nudging Meat off the Plate in Foodservice? A Systematic Review and Meta-Analysis Identifying Moderators in Field-Based Intervention Studies
【字体:
大
中
小
】
时间:2025年11月01日
来源:Journal of Environmental Psychology 7
编辑推荐:
本综述通过对33项实地实验(78个效应量)的系统回顾和荟萃分析,揭示了助推干预在减少肉类消费中的高度异质性(I2=99.97%)。研究发现,针对决策结构(如选择默认项)的干预效果显著(平均减少54%),而基于信息提供或决策辅助的策略则无效。值得注意的是,约30%的干预出现了反弹效应。文章为政策制定者设计有效的、情境敏感的策略以促进可持续饮食提供了关键证据。
减少西方国家的肉类消费对环境和人类健康具有多重益处。科学证据表明,从以肉类为主的饮食转向更多植物基饮食对于健康和环境至关重要,并且符合相应的膳食建议。尽管植物基肉类市场在2021年至2023年间增长了21%,但其在德国肉类市场总量中的份额仅为2%。学术界呼吁采取紧急的、基于证据的政策干预来加速蛋白质转换。
餐饮服务市场在未来几年预计将显著增长,这是由于单人家庭增加、传统膳食结构瓦解、职业女性增多以及饮食习惯个性化等社会发展和生活方式变化所致。大部分人口日常使用机构餐饮服务,包括幼儿园、学校、大学、工作场所、医院、养老院和军事设施中的餐饮服务。因此,机构餐饮服务是政策制定者推动包括减少肉类在内的更健康、更可持续营养的重要杠杆。
当前的学术讨论围绕减少肉类消费的需求侧政策工具展开,包括税收、信息宣传、标签、教育资源提供和助推技术。尽管有令人信服的证据表明税收在减少肉类需求方面非常有效,并会带来显著的健康和环境效益,但公众广泛接受的可能性不大。促进健康环保食品消费的主流公共政策方法通常涉及促进信息获取、实施标签和提供教育,其假设是知情和理性的消费者会做出理性决策。然而,研究表明,食物选择往往更多地由习惯性和自动化过程引导,而非有意识的决策。即使个体有减少肉类消费的意图,这种意图也常常未能转化为实际的行为改变。这些发现凸显了对互补策略的需求,例如助推,它可以解决食物选择中更自动化和习惯性的方面。
助推干预旨在通过改变选择架构而不改变经济激励或限制选择自由,来引导行为(而非态度和信念)朝向对个人和社会有利的决策。由Thaler和Sunstein引入的助推概念将许多不同类型的干预归为“助推”标签下,因此在学术讨论中日益受到批判——既有概念上的(就其定义和边界而言),也有实证上的(关于效应量的异质性)。
本荟萃分析采用了Münscher等人提出的概念框架,该框架基于干预的设计和实施方式进行分类,而非像其他分类法那样强调行为改变背后的认知机制。这种以实践为导向且与政策相关的框架能够对助推干预进行系统分类和实证检验。Münscher等人的分类法区分了三大类干预措施:决策信息、决策结构和决策辅助。
“决策信息”类别包括三种技术:“转换信息”、“使信息可见”和“提供社会参考点”。“决策结构”类别包括四种技术:“改变选择默认项”、“改变选项相关努力”、“改变选项范围或组合”和“改变选项后果”。“决策辅助”类别涵盖两种技术:“提供提醒”和“促进承诺”。
减少肉类消费的助推干预正日益引起政策制定者的兴趣,将其作为减缓气候变化的工具。它推进了政策,超越了仅仅告知消费者减少肉类饮食益处的方式。助推被认为是一种成本效益高且温和的政策工具,它不限制个人自由,而是在不限制选择的情况下温和地引导行为。它有可能通过提供行为洞察,直接针对实际消费者选择,来支持可持续和健康的食品消费策略。
因此,越来越多的政府已经认识到助推作为政策工具的潜力,以鼓励消费者在公共食堂和餐厅选择植物基选项。例如,丹麦的全国植物基饮食行动计划将公共和私人机构餐饮服务确定为助推干预的关键战略目标,以此作为改变饮食习惯的工具。纽约市管理员最近启动了一项领导力倡议,支持在私营部门食堂采用助推和植物优先默认选项,以实现其减少食品相关碳排放的宏伟目标。一些欧洲国家已强制规定公共食堂必须提供纯素和素食选项。
近期围绕Mertens等人(2021)的荟萃分析,就助推的有效性展开了大量讨论。争议焦点在于Mertens等人荟萃分析中Cohen‘s d = 0.43的整体中等效应量。随后的解读和再分析表明,该效应可能被高估了。Maier等人应用一种新提出的偏倚校正技术——贝叶斯荟萃分析(RoBMA),发现支持整体效应的证据薄弱,并得出结论:“在纠正了这种偏倚后,没有证据表明助推作为行为改变工具是有效的。”值得注意的是,作者发现“除食品领域外,所有子领域都存在发表偏倚的有力证据”。Bakdash和Marusich的再分析揭示了七个领域中有四个领域(金融、食品、亲社会行为及其他)存在尖锐的左截断分布,表明存在显著的发表偏倚。他们的发现还表明效应量存在非正态性和高度异质性,这可能削弱荟萃分析均值的代表性。他们强调,发表偏倚阻碍了对助推有效性变异性的正确理解。Szaszi等人应用了三种不同的偏倚校正方法,得出的效应量要小得多且变异很大,即使在考虑了发表偏倚之后也是如此。作者得出结论,重点应从平均效应转向探究特定助推干预在何时、何地以及为何成功,而其他干预则不然。作者建议进行调节因素分析,以探索助推起作用的条件——这仍然是文献中 largely underexplored 的领域。他们还强调需要行为科学领域的“异质性革命”——即承认助推的情境依赖性。
尽管Mertens等人(2021)的结果很可能被高估,但他们的分析为行为领域和助推类型的相对有效性提供了有价值的见解。食物选择尤其敏感,与健康和金融领域相比显示出显著更大的效应量。在纠正了Mertens等人(2021)数据的发表偏倚后,Maier等人发现证据反对大多数行为领域中助推的有效性,而食品领域的证据仍然不确定。虽然关于助推在食品领域的普遍有效性无法得出明确结论,但Maier等人确定了异质性的证据,表明某些助推可能是有效的。此外,Mertens等人(2021)的荟萃分析发现,不同的助推技术在有效性上存在显著差异。决策结构干预(例如,选择默认项) consistently outperformed “决策信息”或“决策辅助”干预。在纠正了Mertens等人(2021)数据的发表偏倚后,Maier等人发现证据反对“信息”和“辅助”干预类别存在效应,而“结构”干预的证据仍然不确定。
Cadario和Chandon(2020)关于健康饮食助推的现场荟萃分析表明,平均效应量适中(Cohen‘s d = 0.23),且存在大量异质性(I2=99.9%)。研究发现,面向行为的干预(d = 0.27)和面向情感的干预(d = 0.12)的效应量显著高于面向认知的干预。此外,与食堂(d = -0.20)或餐厅(d = -0.14)相比,杂货店的效应量显著更低,而食堂和餐厅之间没有显著差异。
大量系统综述广泛综合了关于减少肉类消费的助推干预及其潜在机制的现有研究,但我们仅识别出一项定量综合减少肉类助推效应量的荟萃分析(Chang等人,2023)。然而,该分析仅关注大学环境(即年轻人和青少年),并注意到有效的减少肉类干预在(1)意向改变、(2)自我报告改变和(3)肉类消费的实际(观察到的)改变方面存在巨大异质性。作者建议未来的荟萃分析应优先检查实际行为,以增强外部效度并解决社会期望偏倚,从而促进更精确地估计行为改变。
本荟萃分析特别关注餐饮服务环境中减少肉类的助推,尤其是通过实地研究,以解决几个关键的研究空白。首先,尽管餐饮服务环境是高影响力环境且对助推特别敏感,但现有的荟萃分析通常涵盖广泛的环境和实验设计,聚合结果导致泛化的发现,这可能掩盖不同助推干预在细致多变餐饮服务环境中的表现。其次,许多现有研究关注一般的可持续性指标,而没有深入探讨与肉类消费相关的具体细节。这种缺乏针对性的情况可能限制了对肉类减少独特动态以及针对性助推策略有效性的理解。第三,我们通过专门关注实地干预研究,解决了自我报告行为和实验室环境的局限性,从而提供了对现实生活行为改变的见解。我们的结果将为设计和实施更有效的、针对现实世界环境的助推干预提供基于证据的见解。
越来越多的实地研究直接观察餐饮服务环境中的实际肉类消费行为,但尚未有系统综合来识别现实世界背景下最有效的助推技术。为弥补这一空白,我们进行了调节因素分析,以确定促进有效助推的情境变量,为特定变量如何影响成功干预提供见解。我们的荟萃分析通过关注调节因素和弥合意图-行为鸿沟的实地研究,为有效的助推策略提供了更精确和可操作的见解。它为政策制定者设计针对性干预措施,在这些具有战略重要性的环境中促进可持续饮食和推进气候目标提供了宝贵证据。因此,本荟萃分析提供了当前证据,识别了有效的助推策略,并指导未来旨在促进餐饮服务环境中植物基饮食的研究和政策制定。
具体而言,本荟萃分析通过一项基于遵循PRISMA-P指南设计的预先注册方案的系统回顾,系统地识别和综合了餐饮服务环境中减少肉类助推的现有实地研究。在此过程中,我们全面概述了不同国家、餐饮服务环境和目标人群的当前研究状况。此外,我们评估了助推干预有效性的异质性,并探索了潜在的调节因素(例如,助推技术、餐饮服务环境、人口统计学和方法学特征的差异)。最终,我们能够填补关键的知识空白,并为寻求在餐饮服务中通过行为助推实施证据化策略以减少肉类消费的政策制定者和从业者提供见解。
我们的研究目标是评估主要研究之间的异质性程度,并评估各种调节因素在影响助推干预有效性方面的相对重要性。我们主要关注异质性及其解释调节因素的原因是基于过去的研究,这些研究 strongly suggest 虽然在对助推的研究中进行偏倚校正后,整体平均效应可能很小或不存在,但研究间的效应存在巨大的系统性变异(即异质性)。这种异质性意味着,即使有证据反对存在一般的平均效应,某些助推也可能是有效的。
我们将这些调节因素分为两类:实质性调节因素和方法学调节因素。实质性调节因素是内容相关的方面,例如所采用的助推策略类型和目标人群特征。方法学调节因素包括实验研究的设计和执行。这种分类并非总是泾渭分明。变量“在菜单中的实施”既可以解释为实质性调节因素,也可以解释为方法学调节因素,因为它既与所使用的干预技术类型有关,也与实验设计有关。我们将其归类为方法学调节因素,因为它与研究设置内的设计和交付格式有关——这与我们方法学调节因素的定义一致。在以下部分,我们将提出与这些调节因素相关的假设,并为每个假设提供详细的理论依据。
H1:干预类别。我们假设“决策结构”类别的助推比与“决策信息”和“决策辅助”相关的技术更有效。这一假设植根于助推理论本身和双决策理论,并与先前的荟萃分析一致。
H2:干预技术。我们假设预设特定选项的“选择默认项”是最有效的技术。坚持默认项不需要主动决策,或者至少只需要确认被推广的选项。改变选项范围或组合(例如,列出更多素食选项)预计效果次之,因为它通过增加可得性和显著性来影响选择。这些假设与现有关于不同行为领域助推有效性的荟萃分析以及关于健康饮食助推的荟萃分析一致。
H3:目标人群。参与者的特征,即年龄(H3a)、性别(H3b)以及其中素食者/纯素者的比例(H3c)可能会显著影响助推的有效性。
H3a:年龄。我们预计对年轻人效应量更高,因为他们更乐于改变,因此在生命早期阶段对行为改变干预更敏感。这一假设与Chang等人关于减少肉类干预的荟萃分析结果一致,该分析发现针对大学环境(即年轻人)的研究效应量高于针对一般人群的其他荟萃分析。
H3b:性别。我们预计助推在女性中比在男性中更有效。先前研究表明,女性往往持有更强的环境和动物福利关切,并且更可能遵循气候友好型饮食。减少肉类的助推可能通过符合预先存在的价值观而引起更多女性消费者的共鸣,而男性消费者可能表现出较低的反应性,甚至经历心理抗拒。
H3c:素食者/纯素者比例。我们假设初始样本中素食者/纯素者的比例较高会降低通过助推减少肉类的潜力,因为进一步改变的空间较小,导致效应量降低。
H4:实验设计。我们区分前测后测设计和被试间设计。前测后测设计比较基线和干预期,通常是组内设计,即在两个时期比较相同的参与者。在实地实验中,很难跟踪同一参与者干预前后的情况,因为不同的顾客会光顾食堂,尤其是餐厅,随着时间的推移,这使得它更像一个组间设计。然而,如果设计中存在时间序列,我们仍然将研究归为前测后测设计。在被试间设计中,没有与干预相关的明确时间序列。重点不是随时间的变化,而是比较控制组和干预组。这些组同时进行测试(例如,两家不同的餐厅),或者在一定时期内被(随机)分配到同一环境中。前测后测设计的控制水平较低,因为观察到的变化可能是由于外部因素造成的,例如研究期间发生的无关事件或季节性趋势。然而,尽管它会影响估计效应量时的统计偏倚,但仅基于实验中的控制水平来预测效应量的差异是不可能的。
H5:干预持续时间。我们假设助推干预的有效性会随着时间的推移而降低,因为人们会恢复到习惯性行为。这是由于担心行为改变无法持久,而是每次重新引入助推时效果都会减弱。这一假设仅适用于向同一人群重复暴露于干预的研究,这可能适用于食堂,但不适用于服务不同顾客的餐厅。
H6:时间间隔。前测和后测期/控制组和干预组之间的时间间隔越大,外部因素(例如,素食选项的季节性可用性)影响效应量的可能性就越大。然而,我们无法提出任何具体的假设,因为外部因素可能导致有偏的结果,可能以任一方向影响效应量。
H7:在菜单中的实施。我们预计在菜单上或基于菜单实施的助推(例如,提供菜肴描述或CO2标签)比其他在菜单外的助推(例如,海报、弹出窗口或员工推荐)效应量更高。基于菜单的助推直接影响食物选择的环境,通过利用行为心理学原理(如显著性和框架效应),可能对消费者行为产生更直接和直观的影响。菜单外的其他策略可能仅间接影响行为或需要消费者付出更多努力。这一假设与Stiles等人(2022)的发现一致,他们发现菜单重新设计,其次是菜单标签,是减少肉类消费最有希望的策略。
我们仅纳入经过同行评审的研究,这些研究测试的助推干预符合Thaler和Sunstein的定义,并可归属于Münscher等人的分类法。因此,我们不包括经济激励和教育措施。我们考虑所有专注于减少肉类或推广纯素或素食食品的助推干预。
所选的助推干预需要通过餐饮服务环境中的实地实验或模拟餐饮服务情境的框架式实地研究进行测试。我们的研究中的“餐饮服务”指的是“为即时消费提供餐食和小吃的设施(在外就餐)”,如餐厅、食堂或自助餐厅。框架式实地研究包括受控环境,例如大学餐饮实验室、感官评估室或生活实验室,参与者在其中做出真实的选择并消费实际的餐食。
我们仅纳入允许我们计算控制组和干预组中订购的肉类菜肴数量的研究,因为结果变量是肉类消费的百分比变化。如果鱼和肉的销售数据合并且无法单独确定鱼的比例,我们则排除这些研究。鱼和肉在健康益处、环境影响和消费者认知上存在显著差异,因此孤立看待助推对肉类的影响至关重要。合并这些类别会模糊助推干预对肉类消费的具体影响,因为合并数据的变化可能受到鱼类消费变化的影响。这一排除确保我们的分析准确反映助推干预在减少肉类消费方面的有效性。
在准备研究识别阶段,我们使用搜索词“Nudging”、“Field Study”和“Meat”在Google Scholar上进行了广泛搜索,以识别关于所述不同助推技术的关键文章。之后,我们以该领域的开创性论文为起点进行了前向搜索。在此搜索过程中,我们发现各种被测试的减少肉类消费的策略和干预,根据我们的定义可归类为助推干预,但并不总是明确与助推概念相关联。相反,它们通常与更广泛的行为干预或与标签和信息提供相关的理论相关联。为了捕捉所有符合我们“助推”定义标准的干预措施,我们在后续的关键词搜索中不包含该特定术语。
随后,我们在以下数据库中进行了关键词搜索,以识别来自多个学科(经济学、社会科学、心理学和公共卫生)的相关科学文章:Web of Science、Scopus、PubMed、ProQuest、Medline、PSYNDEX、PubPsych、PsycIn。所有数据库的搜索字符串由三个搜索组件组成:第一个涵盖所需的研究类型,即(框架式)实地研究;第二个是餐饮服务环境;第三个涉及结果变量,即肉类减少或推广素食/纯素/植物基食品。由于上述原因,我们决定不包含第四个搜索词来限制特定的干预策略。搜索未施加任何日期或语言限制;然而,由于资源限制,仅纳入以英语、意大利语和德语进行的研究。
此外,我们还检查了关注减少肉类策略的系统综述和一项荟萃分析的参考文献列表。文献搜索于2023年10月初完成。通过数据库和注册库识别研究以及随后的研究选择过程见图1:“PRISMA 2020流程图”。
通过不同搜索策略(数据库、前向搜索、综述筛查)检索到的论文被导入指定的Mendeley文件夹中。该文件夹的命名规则映射了PRISMA流程图的漏斗结构。随后将这些文件夹导入AI支持的筛选工具Rayyan,该工具有助于重复项检测。在此之后,进行了手动搜索以识别任何额外的重复项(去重后的研究数量n = 117)。
然后我们进行了初步的预筛选阶段,由两位评估者(本研究的第一作者和一名学生助理)审查了24项随机选择的研究的摘要。在此审查过程中发现的任何差异都通过讨论解决。之后,由相同的评估者对所有研究进行了完整的标题-摘要筛选,任何进一步的差异也通过讨论解决。
从标题-摘要筛选阶段晋级的所有记录(n=47)连同全文PDF被复制到一个单独的文件夹中进行全文审查。鉴于研究数量有限且搜索的复杂性,决定在完整的标题-摘要筛选中,每项研究由每位评估者审查。在审查过程中使用预定义的纳入和排除标准来选择符合条件的研究。两位评估者都参与了合格研究的筛选,以降低错误和个人偏见的风险。当出现分歧时,会对研究进行彻底检查和讨论,直到达成共识。最终样本包括28篇论文。数据可在补充材料中获取。
编码方案是基于PsychOpen CAMA模板开发的。我们提取了报告层面(作者、年份)、研究层面(国家、年份、人口统计学信息的可用性、实验针对的用餐时间、菜单设计、在餐桌或服务台提供的支持助推有效性的信息、口头提示)、样本层面(年龄、教育程度、性别、饮食习惯、环境)和结果层面(助推类别、助推技术、实验持续天数、控制期和干预期素食和纯素菜肴的比例、控制期和干预期供应的菜肴(肉类、鱼类、素食和纯素)数量、控制期和干预期肉类菜肴(不包括鱼类)数量)的详细信息。
相同的两位评估者从符合条件的论文中收集数据。在编码之前,对编码簿进行了彻底审查和讨论,并通过编码三项研究进行了试点测试。随后,每位评估者独立对所有研究进行编码。每周会议审查和讨论个别的编码决定,所有冲突均通过讨论解决。在初步编码样本后,考虑到研究设计的高度多样性和所提供数据的复杂性,认为这种方法合适。
我们使用的结局指标是基于两个测量点(有助推干预与无助推干预)之间有/无肉类供应的菜肴比例的风险差。技术上,我们使用R包metafor中的RD度量。
分析中总共纳入k=78个效应量。观察到的肉类消费百分比变化(操作化为风险差(RD)效应量)范围从-85%到+13%,大多数估计值为负(73%)。基于随机效应模型估计的肉类消费平均百分比变化为-11%(95% CI:-15% 至 -6%)。因此,平均结局与零有显著差异(z = -4.65, p < 0.01)。
根据Q检验,真实结局似乎是异质的(Q(77) = 6042.08, p < 0.01, τ2 = 0.04, I2 = 99.97%)。真实结局的95%预测区间为-50%至28%。因此,尽管平均结局估计为负,但在某些研究中,真实结局实际上可能是正的,这需要通过调节因素分析来探索这些估计值发生变化的条件。
对学生化残差的检查显示,有两项研究(Hansen等人(2019),效应量#1;Hansen等人(2019),效应量#2)的值大于±3.41,可能是该模型中的潜在异常值。根据Cook距离,有六个效应量(Radnitz等人(2023),效应量#2;Hansen等人(2019),效应量#1;Hansen等人(2019),效应量#2;Hansen等人(2019),效应量#3;Taufik等人(2022),效应量#1;Boronowsky等人(2022),效应量#2)可能具有过度影响力。
进行了几项额外的敏感性分析以探索估计值的稳健性,特别是异质性的量(即执行多水平荟萃分析,排除有影响力的案例)。虽然最佳拟合的多水平模型(三水平,结局嵌套于论文中)并未实质性改变报告的发现,但排除上述六个有影响力的案例后,肉类消费的百分比变化为-5%(95%CI;-1% 至 -23%;Q(71) = 5309.35, p < 0.01, τ2 = 0.0067)。对于这个三水平模型,异质性的量仍然非常大,达到I2 = 99.85%。所有分析均可使用补充材料重现。
回归检验表明漏斗图不对称(p < 0.01),但等级相关检验则不显著(p = 0.12)。估计值的漏斗图如图2所示。为了进一步研究发表偏倚的潜在影响,我们拟合了两个选择模型,即β选择模型和截断分布选择模型。基于β选择模型校正后的肉类消费平均百分比变化为-9.5%(相对于未校正模型的-11%),截断分布选择模型为-8%。我们认为这些调整是微小且非实质性的,因为整体结论保持不变。此外,必须重点强调,考虑到我们的分析中观察到的非常大的研究间异质性,这些发现应极其谨慎地解释。所有分析均可使用补充材料重现。
在这种情况下(异质性量大),解释整体平均效应需要格外谨慎。单一的合并估计值将是真实效应的一个差劲且可能具有误导性的表征。相反,分析的重点应从单一平均值转向调查这种深刻不一致的来源,即探索调节因素的作用。因此,在接下来的两节中,我们将总结两组调节因素分析,以探索纳入研究之间预期巨大异质性的潜在来源。调节变量是能够影响结局方向或强度的特征。识别和理解这些调节因素对于解释整体效应大小以及为观察到的效应在何种条件下最为显著提供见解至关重要。
为了系统地研究各种调节因素的影响,我们将其分为两个不同的组,即实质性调节因素(干预类别、干预技术、样本中素食者/纯素者的比例、年龄和性别)和方法学调节因素(实验设计、实验环境、干预持续时间、时间间隔、在菜单中的实施)。
表2展示了针对五个具有实质性变量的调节因素分析所得到的效应大小。它包括每个分析及每个调节因素水平(针对分类调节因素)的结局数量(k)、效应大小(ES)估计值及其相应的标准误(SE)和95%置信区间(CI)。此外,还报告了调节因素检验的Q检验和R2估计值,以及针对潜在发表偏倚校正后的平均估计值。该表清晰地比较了每个调节变量不同水平如何影响整体效应大小。所有调节变量的频率统计表可在补充材料中获取。
关于第一个调节因素,即干预类别,它解释了效应大小中约30%的变异性,分析表明“决策结构”干预类别(肉类减少29%,95%CI:21%-35%减少)是唯一有效的类别,而对于“决策信息”和“决策辅助”,均未观察到显著的肉类减少。对于调节因素干预技术,它解释了近80%的异质性,只有改变选择默认项导致了显著的肉类减少,平均达到54%(95 CI:47%-61%)。对于所有其他技术,要么没有可用证据(对于技术:改变选项相关努力、改变选项后果、提供提醒),要么平均效应估计值与零没有差异(对于技术:转换信息、使信息可见、提供社会参考点、改变选项范围或组合、促进
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号