利用虚拟现实(VR)复兴任务比较替代强化中的暂停(TO)与消退(EXT)对行为复现的干预效果

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年09月25日 来源：Learning and Motivation 1.8

编辑推荐：

　　本研究通过虚拟现实(VR)技术，创新性地比较了消退(EXT)与暂停(TO)两种程序在替代强化期间对目标行为复现(resurgence)的干预效果。研究人员在VR环境中采用多计划表程序，未发现TO与EXT在缓解人类操作行为复现方面存在显著差异，为行为干预策略提供了新证据，并展示了VR技术在提升生态效度方面的应用潜力。

在行为心理学和应用行为分析领域，行为的复发，特别是被称为“复现(resurgence)”的现象，一直是一个核心且具有挑战性的问题。复现指的是一个先前已被消除的行为，当替代行为的强化条件恶化时，会再次出现。理解并有效缓解复现对于从理论层面剖析行为的基本过程，到临床应用（如防止药物滥用复发、设计有效的行为矫正干预措施）都具有极其重要的意义。

传统的减少问题行为的方法主要包括消退(Extinction, EXT)和惩罚。负性惩罚(Negative Punishment)，特别是其中一种广泛应用的形式——暂停(Time-Out, TO)，因其在减少目标行为方面可能比消退或正性惩罚更有效，且通常被认为产生不良副作用（如情绪困扰或攻击性）的可能性更小，而在临床和教育环境中受到青睐。然而，关于TO在复现准备期间是否能比EXT更有效地减轻行为复现，现有的研究结论并不一致。

例如，Houchins等人（2021）在人类被试中使用电脑屏幕点击任务的研究发现，在减轻复现方面，TO程序并未产生与EXT显著不同的结果。但有趣的是，Flores等人（2025）在大鼠被试中使用杠杆按压任务的类似研究却报告称，TO比EXT更可靠地降低了复现的可能性和幅度。这种差异可能源于物种特异性，也可能源于方法论上的不同。许多人类行为研究依赖于简化的实验室任务（如点击鼠标），这些任务虽然能提供精确的控制，但可能无法完全捕捉人类在自然环境中复杂的协调运动模式，有时甚至被参与者评价为“枯燥”，从而可能影响结果的生态效度和普遍性。

为了解决这些问题，并进一步探索TO在缓解复现中的作用，本研究的研究人员采用了一项重要的技术创新——虚拟现实(Virtual Reality, VR)。VR技术能够在保持实验控制精度的同时，极大地增强任务的生态效度，为研究复杂的行为过程提供了一个更有前景的框架。本研究的目标是双重的：1）在VR环境中，比较TO和EXT作为替代强化阶段的目标反应减少程序，对后续复现的缓解效果；2）探索基于VR的操作性方法在研究行为现象方面的潜在优势。

本研究发表在《Learning and Motivation》上，研究人员为开展此研究主要应用了以下几项关键技术方法：研究招募了20名19至26岁的本科生作为有效参与者。实验采用单一的Meta Quest 3 VR头戴式显示器(HMD)呈现刺激，实验程序使用Unity引擎和C#编程。核心方法是在VR环境中创建了一个多计划表(Multiple Schedule)程序，该程序包含交替呈现的EXT和TO成分，分别由不同的视觉（蓝天白云vs黑暗雨天）和听觉（鸟鸣声vs雨声）刺激信号提示。目标反应(TR)是使用棕色虚拟枪射击气球，替代反应(ALT)是使用黑色虚拟枪射击。实验分为三个连续阶段：第一阶段（4分钟）在两个成分中均强化TR（VI 2s计划）；第二阶段（4分钟）在两个成分中均强化ALT，但TR在EXT成分中接受消退，在TO成分中则触发5秒的暂停期（期间所有反应无效）；第三阶段（1分钟）为复现测试，两个成分中ALT和TR均处于消退状态。数据分析采用Wilcoxon符号秩检验和二项式检验，比较不同阶段和成分间的反应率差异。

2.3.1. Set up and pretraining

参与者佩戴VR头显后，进入一个虚拟环境，并通过画布上的指令学习如何使用控制器抓取枪支和射击。他们需要练习操作，为正式实验做准备。

2.3.2. Phase 1 – Reinforcement of the target response

实验第一阶段，气球开始随机出现在参与者前方。多计划表的两个成分（A和B）以严格交替的方式呈现，各持续30秒。成分A由蓝天、鸟鸣和绿色气球标示，成分B由阴天、雨声和红色气球标示。在此阶段，使用棕色枪（目标反应，TR）击中气球会在两个成分中均按VI 2s计划获得强化（气球爆裂、得分和视听反馈），而使用黑色枪（替代反应，ALT）则永远不会被强化。此阶段持续4分钟，每个成分呈现4次。结果显示，所有参与者都在此阶段习得了TR，而大多数参与者的ALT反应在阶段末期降至接近零。

2.3.3. Phase 2 – Reinforcement of the alternative response

实验第二阶段，强化 contingencies 发生改变。参与者被分为两组：“EXT优先”组首先经历EXT成分，“TO优先”组首先经历TO成分。在此阶段，ALT在两个成分中均按VI 2s计划获得强化。TR的后果则因成分而异：在EXT成分中，TR导致消退（无任何后果）；在TO成分中，TR会触发一个5秒的TO期（期间两支枪都无法发射有效子弹，任何TR都会重置TO计时）。此阶段同样持续4分钟。结果显示，进入第二阶段时，“EXT优先”组的一些参与者表现出TR的短暂增加（可能为消退爆发），但统计上不显著；而“TO优先”组的参与者则在其第一个TO成分中表现出TR的显著减少。随着阶段的进行，所有参与者的TR和TO期内的反应均减少，而ALT反应增加。

2.3.4. Phase 3 – Resurgence test

实验第三阶段是复现测试阶段，仅持续1分钟，呈现两个成分。在此阶段，ALT和TR均被置于消退状态。结果显示，对于绝大多数参与者，无论其属于哪个平衡条件，当ALT的强化被停止后，TR的反应率相较于第二阶段末均出现了显著增加，这表明发生了清晰的行为复现现象。

4. Discussion

本研究成功地在VR实验设置中观察到了目标反应的复现，这一定义为由于替代强化条件恶化而导致的行为反应相对于前一阶段的增加。研究结果与Houchins等人（2021）的报告一致，即与消退程序相比，暂停(TO)程序似乎并未能更有效地减轻目标反应。这表明复现现象的核心特征具有稳健性(robust)。

本研究的一个关键方法学贡献在于使用了非消退程序（即TO）来考察复现，扩展了复现研究的范围。尽管与Flores等人（2025）在大鼠中的研究结果存在差异（其发现TO更有效），但本研究与Houchins等人对人类的研究均未发现两种程序间的系统性差异。这种差异可能归因于物种或程序细节的不同，有待进一步研究澄清。

研究还发现，实验条件的呈现顺序（EXT优先 vs. TO优先）调节了第二阶段早期的表现模式。“EXT优先”组部分参与者表现出可能的消退爆发(extinction burst)，而“TO优先”组则未出现此现象，但出现了TO期反应的增加。这突出了在复现研究中采用平衡设计的重要性，也表明训练顺序本身可以塑造行为结果。

本研究与Houchins等人研究的一些差异也值得讨论。在VR任务中，在TR和ALT之间切换需要更复杂的动作（寻找另一支枪、放手、再抓取），这比鼠标点击更为繁琐，可能无意中引入了反应交替后的变更延迟(change-over delay)，这可能更好地代表了应用场景。此外，本研究的总会话时长极短（10分钟），但依然复制了核心发现，这显示了VR方法在精简数据收集方面的潜力。仅一名参与者报告了轻微不适，大多数参与者表现出投入，提示VR可能有助于提高参与度。

综上所述，本研究的结果表明，在针对人类操作行为的复现准备中，消退(EXT)和暂停(TO)都是减少目标反应的有价值工具，但在此VR设置下，TO并未显示出比EXT更强的缓解复现的优势。据我们所知，这是首次在VR中涉及复杂运动模式的TO基础研究演示，凸显了此类程序的转化潜力及其扩展传统行为范式范围的能力。未来的研究可以进一步比较消退与其他行为减少策略（如正性惩罚或其他形式的负性惩罚如反应代价(response cost)）。从应用视角来看，这些发现为临床、教育和组织环境中设计行为矫正策略提供了宝贵的见解。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号