
-
生物通官微
陪你抓住生命科技
跳动的脉搏
选择与拒绝条件控制在样本匹配和刺激等价关系形成中的作用机制研究
【字体: 大 中 小 】 时间:2025年09月13日 来源:Journal of the Experimental Analysis of Behavior 1.9
编辑推荐:
本研究发现标准匹配样本(MTS)程序更易促进真实等价类的形成,而非仅依赖选择控制。通过四组训练对比(标准MTS、专一选择控制、专一拒绝控制、分离MTS),结合新颖刺激(N)替换S+/S?的测试策略,揭示了等价关系涌现需联合选择与拒绝控制(即分离MTS组表现最优),而单一控制易导致"伪等价"。研究为理解刺激等价(stimulus equivalence)的行为机制提供了新视角,对符号行为研究具有重要启示。
引言
刺激等价范式在行为分析研究中占据核心地位逾40年,由Sidman和Tailby(1982)形式化提出。该范式表明,在训练任意条件性辨别后,新的条件性辨别会展现出等价属性——反射性(reflexivity)、对称性(symmetry)和传递性(transitivity)。例如,给定刺激集A、B和C,训练AB和BC辨别(第一个字母表示样本刺激,第二个字母表示比较刺激)可导致反射性(AA、BB、CC)、对称性(BA、CB)和传递性(AC、CA)关系的涌现。
标准匹配样本(MTS)程序是训练和评估等价关系最广泛使用的方法。该程序涉及呈现一个样本刺激,随后呈现多个比较刺激,要求受试者根据样本选择比较刺激。参与者可以学习每种样本刺激与比较刺激之间的两种条件关系:(a)选择或样本-S+(sample-S+)关系,即选择被强化的比较刺激;(b)拒绝或样本-S?(sample-S?)关系,即选择不被强化的比较刺激。在双选择MTS中,正确反应可通过条件选择关系、拒绝关系或两者共同控制。
刺激等价关系研究的主要问题之一是确定其涌现的前因刺激控制条件。Murray Sidman(Carrigan & Sidman, 1992; Johnson & Sidman, 1993)提出,等价关系的涌现完全取决于训练中建立的条件选择关系。他认为,未能建立等价关系是训练中获得的拒绝控制效应所致。选择和拒绝控制机制均可产生等价关系,但这些关系相互排斥。例如,在训练条件关系AB和BC时,选择控制将建立刺激A1B1C1和A2B2C2之间的等价关系,而拒绝控制将建立刺激A1B2C1和A2B1C2之间的等价关系。这些不同的控制类型在反射性和传递性测试上产生不同结果,但在对称性测试上则不然。
如果选择和拒绝控制产生不相容的等价关系,那么关于标准MTS程序如何能够涌现刺激等价关系就成为一个关键问题。该程序有潜力同时建立条件选择和拒绝控制。例如,Stromer和Osborne(1982)证明,双选择标准MTS程序使用新颖刺激测试时会产生条件和拒绝控制。Sidman(1987; Carrigan & Sidman, 1992)建议,为了最小化拒绝控制的影响,应使用每个试验有三个或更多比较刺激的MTS程序。然而,双选择标准MTS程序形成等价关系的概率很高,且不低于使用三个或更多比较刺激的MTS程序。此外,使用标准MTS程序证明等价的个体通常在条件和拒绝控制测试中表现出强劲性能。目前,标准MTS程序下等价关系涌现的行为机制仍不明确,尤其是双选择格式。
方法
参与者
48名来自一所私立大学的一年级心理学学生参与本研究,通过便利抽样招募。样本包括35名女性和13名男性,年龄范围17至28岁(平均19.4岁,标准差3.7岁)。未收集其他人口统计信息。采用区组随机化程序将每位参与者分配到四组之一,每组12人。所有参与者在实验前提供知情同意,并在完成所有阶段后获得相当于约7.21美元(当地货币)的经济补偿。提前退出的参与者获得该金额的三分之一。
装置和刺激
实验任务在计算机上进行,参与者单独就坐于配备耳机的工作站,工作站间有隔板防止视觉接触。刺激包括各种非拉丁字母表的字母,以黑色呈现在白色背景上,尺寸为3.5×3.5厘米。每个刺激分配有字母数字代码以供识别。训练刺激包括六个标记为A、B和C的项(A1、A2、B1、B2、C1、C2),旨在形成两个三成员等价类。额外刺激(16个标记为W、X、Y和Z)用于根据Carrigan和Sidman(1992)建立的程序偏置响应朝向专一选择或专一拒绝关系。八个N刺激用于测试试验。实验任务使用Psytoolkit编程。
程序
采用带观察要求(MTS-OR)的MTS程序。在此程序中,刺激最初被黑色方块掩盖,要求参与者进行观察响应(OR)以取消掩盖刺激。每个试验开始时,屏幕顶部中央呈现一个掩盖的样本刺激,其下方有一个OR按钮。当参与者进行OR时,样本刺激显示,比较刺激——同样被黑色方块掩盖——出现在屏幕底部,各有一个OR按钮。点击比较刺激的OR按钮会显示该刺激0.3秒,然后黑色方块重新出现。一旦两个比较刺激都被观察,“LOOK”按钮上的文字变为白色,OR按钮变为无效。随后,两个标记为“CHOOSE”的按钮出现在比较刺激下方,允许参与者选择其中一个比较刺激。正确选择触发“ta-da”声音并在屏幕顶部的计数器中增加一点;错误选择产生不和谐的“和弦”声音。反馈后,呈现0.5秒的试验间间隔,期间仅计数器可见。
训练阶段
四组区别在于实施两种程序:(1)Sidman及同事使控制偏向专一选择或专一拒绝关系的方法;(2)Perez及同事在训练试验中使注意偏向S+或S?刺激的方法。Sidman的程序(Carrigan & Sidman, 1992; Johnson & Sidman, 1993)通过要求参与者学习更多样本-S?而非样本-S+关系,使用W和Z刺激训练,使控制偏向专一选择关系。相反,通过要求参与者学习更多样本-S+而非样本-S?关系,使用X和Y刺激,使控制偏向专一拒绝关系。Perez的程序(Perez et al., 2015, 2019, 2020)通过操纵刺激的取消掩盖来偏置注意。对于注意S+,在50%的实例中阻止S?的取消掩盖;类似地,通过阻止S+的取消掩盖使注意偏向S?。
标准MTS组未接受控制或注意偏置程序,但接受了MTS-OR协议训练。专一选择组接受了针对S+的控制和注意偏置程序。专一拒绝组接受了针对S?的这些程序。分离MTS组接受了针对S+和S?交替试验的控制和注意偏置程序。前三组参与者经历了四个训练阶段,分离MTS组由于程序交替经历了八个阶段。
测试阶段
所有四组参与者完成相同的测试阶段,顺序相同。首先进行条件控制测试,随后是AC传递性测试、BA和CB对称性测试、CA组合传递性/对称性(等价)测试,最后是AA、BB和CC反射性测试。所有阶段中,基线试验与测试试验混合以评估基线响应的维持。对于标准MTS、专一选择和专一拒绝组,每个阶段包括12个基线试验;对于分离MTS组,每个阶段包括16个基线试验。基线试验类型在各组和各阶段间有所不同。
在条件控制测试阶段,除了基线试验外,还包括评估AB和BC条件关系的试验,其中新颖刺激(N)替换S?或S+比较刺激。具体来说,有八个试验中N刺激替换S?比较刺激,以评估选择条件控制;另外八个试验中N刺激替换S+比较刺激,以评估拒绝条件控制。
随后的对称性、等价性和反射性测试阶段结构相同,各包括四种试验类型:基线试验、八个特定测试试验、八个N?试验和八个N+试验。标准MTS、专一选择和专一拒绝组每阶段总试验数为36,分离MTS组为40。
如果参与者在任何测试阶段表现出基线恶化,则重新训练AB和BC关系,并重新评估学习测试。然后重复相应的测试阶段。重新训练标准是标准MTS、专一选择和专一拒绝组基线响应正确数少于9次,或分离MTS组少于13次。未能在单个测试阶段三次重新训练尝试后满足基线维持标准的参与者被从实验中移除。
结果
训练阶段
各组参与者在训练阶段达到既定标准所需的区组数如表4所示。标准MTS组完成阶段1需1至7个区组(平均2.8),阶段2需1至3个区组(平均1.5),阶段3需1至6个区组(平均1.8)。除P5需两次暴露外,所有参与者在一个区组内完成学习测试(平均1.1)。专一选择组阶段1需2至11个区组(平均4.2),阶段2需1至5个区组(平均2.1),阶段3需1至9个区组(平均2.2)。除P23和P24分别需五次和两次暴露外,所有参与者在一个暴露内完成学习测试(平均1.4)。专一拒绝组阶段1需2至8个区组(平均3.7),阶段2需1至16个区组(平均4.8),阶段3需1至10个区组(平均3.6)。大多数参与者在一个暴露内完成学习测试;然而,P30和P33需四次暴露(平均1.8)。分离MTS组(除P48外)阶段1需1至4个区组(平均2.4),阶段2需1至2个区组(平均1.9),阶段3需1至12个区组(平均4.9),阶段4需1至3个区组(平均1.6),阶段5需1至6个区组(平均1.8),阶段6需1至2个区组(平均1.3),阶段7需1至5个区组(平均1.6)。所有参与者在一个暴露内完成学习测试。P48阶段1至5需8至20个区组,但在阶段6的第11个区组退出实验。
测试表现
使用两个不同标准评估等价关系的形成:一个用于“选择等价”关系,另一个用于“拒绝等价”关系。选择等价关系形成的标准是在测试传递性、对称性、等价性和反射性的试验中正确响应至少87.5%。相反,拒绝等价关系形成的标准是在传递性、等价性和反射性测试中正确响应不超过12.5%,且在对称性测试中正确响应至少87.5%。这些标准与Carrigan和Sidman(1992)建立的标准一致。
N?和N+测试的表现被分类为“高”(如果正确率超过87.5%)或“预期关系反转”(如果低于12.5%)。反转被认为是准确的,因为它们展示了一致的响应模式并提供了有价值的见解。
图2至图5显示了各组每个参与者在测试阶段每种测试试验类型上的正确响应比例。白条表示基线试验,黑条表示等价测试试验(即传递性、对称性、等价性和反射性),浅灰条表示N?测试试验,深灰条表示N+测试试验。在条件控制阶段,仅呈现基线、N?和N+测试条。参与者可能经历测试阶段多次,但仅报告最终测试阶段暴露的数据。
标准MTS组在条件控制阶段的所有参与者均在基线和选择控制试验上表现出高表现。一半参与者在拒绝控制试验上表现出高表现(P1、P3、P5、P9、P10、P12),P4表现出响应反转。一半参与者满足选择等价标准(P1、P2、P3、P4、P9、P12)。其中三名参与者(P1、P3、P9)在N?和N+试验上表现出高表现,一名(P12)在所有N?试验和6/8 N+试验上表现出高表现。参与者P2和P4在N?试验上表现出完美表现,但在N+试验上表现低(P2)或反转(P4)。三名参与者(P7、P10、P11)在5/7等价属性测试上满足标准,在N?试验上表现出完美(P7)或高表现,在N?试验上表现出不规则表现或反转(P7)。参与者P5、P6和P8在所有类型试验上表现出高度不一致的表现以及基线恶化。P6在所有等价(CA)测试试验和BB及CC反射性测试上表现出有趣的反转模式。
专一选择组在条件控制阶段,九名参与者在基线试验上表现出高表现,除P13、P16和P23外(尽管P13和P16有10/12正确响应)。所有参与者在选择控制测试上表现出高表现,十名参与者在拒绝控制测试上表现出响应反转(除P20和P23外)。P23在条件控制阶段三次未能满足基线标准后终止任务。其余参与者在N?试验上表现出高或完美表现(除P20外),大多数在大多数N+试验上表现出反转。仅两名参与者达到选择控制等价标准(P19和P22)。他们在N?试验上表现出完美表现,在N+试验上表现出完美反转。四名参与者(P13、P18、P20、P21)在5/7或6/7等价测试上满足标准,在N?试验上表现出完美或高表现,在N+试验上表现出完美反转或不规则结果。其余参与者在等价属性测试上表现出不规则表现。
专一拒绝组大多数参与者被重新测试。在条件控制阶段,五名参与者在基线试验上表现出高表现,尽管其余参与者有10/12正确响应。在选择控制测试试验上,P26表现出高表现,其余参与者表现出响应反转(除P29和P36外)。所有参与者在拒绝控制测试上表现出高表现,除P29外。一名参与者(P29)满足选择等价标准,并在所有N?和N+测试上得分高。P31和P36在6/7测试上满足选择等价标准,在N?测试上表现不规则,在大多数N+测试上表现不规则(P31)或高。没有参与者表现出拒绝控制等价模式。P26和P28在传递性和等价性试验上表现出响应反转或极低分数,但在对称性上得分高,但两者在所有反射性测试上得分高。有趣的是,在反射性测试上,他们在N?试验上表现出高响应,在N+试验上表现出不一致响应,相对于先前阶段改变了响应模式。其他参与者表现出一些拒绝等价的特征性反转:P26在AC上,P27在BB上,P33在AC和AA上,P32在所有反射性测试上。他们主要在这些测试的N?试验上表现出反转模式,在N+试验上表现出高表现。其余参与者未表现出清晰模式或在等价属性测试上表现一致,一些表现出基线恶化。
分离MTS组参与者P48的结果未显示,因为他在完成训练阶段前退出。在条件控制阶段,所有参与者在基线和选择控制试验上表现出高表现,九名参与者也在拒绝控制试验上表现出高表现(除P43和P47外)。该组八名参与者达到选择等价标准(P37、P38、P40、P41、P42、P44、P45、P46)。其中六名(P40、P41、P42、P44、P45、P46)在所有或大多数N?和N+测试上得分高。P37在大多数N+试验上得分高,在N?试验上得分不一致,P38表现出相反模式。另外两名参与者P39和P47在6/7等价属性测试上得分高。P39在大多数N+测试上得分高,但在N?测试上结果不一致,而P47表现出相反模式。P43在各阶段所有类型测试上呈现不一致响应。该组参与者需要最少的重新训练或重新暴露于测试。
统计分析
表6显示了各组在每个测试上的平均正确响应数。采用Kruskal-Wallis检验比较各组在每个测试上的表现,并使用Dunn事后检验建立组间差异。在等价属性测试上,标准MTS和分离MTS组通常呈现最高准确度,两者间无统计差异,而专一选择和专一拒绝组呈现较低准确度,两者间无差异。专一选择组在对称性测试上表现低于标准MTS组,在BA、CA和AA测试上低于分离MTS组。专一拒绝组在传递性和反射性测试上得分低于标准MTS组(如预期),并在所有测试上低于分离MTS组。在N?测试上,标准MTS、分离MTS和专一选择组无差异,且几乎所有情况下均高于专一拒绝组。在N+测试上,标准MTS、分离MTS和专一拒绝组在大多数情况下无差异,且三者几乎在所有测试上均与专一选择组不同。
反应时间
还测量了测试试验上的反应时间。反应时间测量为第二个OR到比较刺激与响应其中一个“CHOOSE”按钮之间的时间差。图6显示了四组所有测试阶段上等价测试试验与N?和N+试验响应之间反应时间差异的平均值。等价测试试验与N?试验之间的响应差异对于专一选择(平均129毫秒)和专一拒绝(平均40毫秒)组为正,表明这些组对N?试验的响应总体上快于等价测试试验。相反,对于标准MTS(平均-4毫秒)和分离MTS组(平均-6毫秒),差异最小。四组呈现等价测试试验与N+测试试验之间的负差异,表明参与者通常需要更多时间选择N+试验,尽管这些差异对于标准MTS(平均-143毫秒)和分离MTS(平均-148毫秒)组高于专一选择(平均-36毫秒)和专一拒绝(平均-30毫秒)组。
等价测试试验与N?和N+试验之间的反应时间差异存在显著差异,F(1, 316)=37.571,p<0.001,η2=0.037。四组间也存在显著差异,F(3, 316)=4.069,p=0.007,η2=0.024。Holm事后分析显示,专一选择组与标准MTS组,t(21)=-2.870,p=0.026,和分离MTS组,t(21)=-2.839,p=0.026,之间的反应时间存在显著差异。N?和N+试验差异与四组之间的交互作用不显著,F(3, 316)=0.989,p=0.398,η2=0.003。Holm事后分析显示,标准MTS组,t(22)=3.355,p=0.021,分离MTS组,t(20)=3.351,p=0.021,和专一选择组,t(21)=3.861,p=0.004,在N?和N?试验之间的差异存在差异。专一选择组N?试验的差异与标准MTS组,t(21)=5.289,p<0.001,分离MTS组,t(20)=5.258,p<0.001,和专一拒绝组,t(21)=3.064,p=0.048,N+试验的差异之间存在统计差异。最后,专一拒绝组N?试验的差异与标准MTS组,t(22)=3.605,p=0.008,和分离MTS组,t(21)=3.609,p=0.008,N+试验的差异之间存在差异。
讨论
本研究的目的是确定与使用标准MTS程序形成等价关系相关的条件控制类型是否完全基于选择控制或涉及选择和拒绝控制。由于这无法通过典型等价测试直接确定,因此使用新颖刺激进行等价试验,以替换错误刺激(N?)或正确刺激(N+)。将使用标准MTS程序训练的参与者与基于专一选择控制、拒绝控制或两者(分离MTS组)训练条件关系的参与者进行比较。N?和N+测试上的表现作为间接指标,表明每组学到了什么。此外,Carriga
生物通微信公众号
知名企业招聘