
-
生物通官微
陪你抓住生命科技
跳动的脉搏
情境中的时空视觉统计学习:内部偏倚与动态线索如何共同塑造环境结构的内隐表征
【字体: 大 中 小 】 时间:2025年09月20日 来源:Cognition 2.8
编辑推荐:
为解决传统视觉统计学习(VSL)研究将空间(sVSL)与时间(tVSL)割裂、忽略情境影响的问题,研究人员开展了时空VSL(stVSL)研究。通过动态呈现和遮挡操纵,发现时空统计与运动、遮挡偏倚共同作用,支持从纯时间信息推断空间结构,揭示了VSL是整合低阶统计与高阶内部偏倚的复杂解释过程。
在我们日常感知的视觉世界中,空间模式随着时间动态展开,时空规律天然交织,而我们对环境的理解又深受各种内部偏倚的影响。然而,传统视觉统计学习(Visual Statistical Learning, VSL)研究通常将空间学习(sVSL)和时间学习(tVSL)分开探讨,并将它们置于缺乏真实情境效应的“真空”中。这种分离简化了问题,但也严重限制了我们对大脑如何自然地从复杂动态输入中学习并表征环境结构的理解。现实情况是,空间和时间统计信息不仅同时存在、相互作用,其解读还受到由运动、遮挡等线索引发的高级内部偏倚的强烈调制。为了深入探索时空统计之间的相互依赖关系,以及它们与内部偏倚的交互作用,研究人员开发了一种新颖的时空视觉统计学习(spatio-temporal VSL, stVSL)范式,并以此展开了一系列研究,成果发表在《Cognition》上。
为开展本研究,研究人员主要采用了经过改良的时空视觉统计学习(stVSL)实验范式。该范式在一个大的虚拟环境中布置由抽象形状对构成的空间模式,参与者通过一个3×3的网格“孔径”观察该环境。环境会以单单元格为步长进行周期性移动,从而动态地呈现完整或部分场景。关键技术创新包括:系统操纵输入中时空统计的不确定性(如通过移动产生形状对的局部呈现);引入动画来提供连贯运动感知或将其移除以考察其效应;添加静态遮挡条来研究遮挡偏倚;并设计了多种2AFC(双选择强迫任务)测试类型(标准学习测试、空间学习测试、偏倚测试)来分别评估对形状共现、空间结构取向以及整体反应偏倚的学习情况。实验通过在线平台(如Prolific)招募成人参与者,数据收集后采用频率统计和贝叶斯因子(Bayes Factor, BF)进行综合分析。
研究人员首先在实验1a和1b中建立了基线。实验1a使用新的stVSL设置,场景在孔径下移动,参与者能学习到嵌入动态时空输入中的底层静态空间结构(性能显著高于几率水平:M=57.7%, t(17)=3.18, p=0.005, BF=8.8)。实验1b在线复制了经典的sVSL研究(Fiser & Aslin, 2001),同样观察到显著学习(M=56.5%, t(17)=2.60, p=0.019, BF=3.2),表明经典范式可成功迁移至在线环境,且新范式下学习是可行的。
随后,实验2a-c深入探讨了时间连贯性和感知运动在学习空间视觉结构中的作用。实验2a( Temporal + Animation条件)中,通过操纵移动方向(例如,75%水平移动,25%垂直移动),人为制造了不同空间噪声水平(平行、垂直、对角对的条件概率分别为0.75, 0.916, 0.6)。结果发现,尽管对角对的空间噪声最高,其学习效果却最好(M=58.7%),显著优于平行对(M=54.4%)。实验2b移除了动画但保留时间连贯性(Temporal条件),学习效果整体减弱(整体M=53.4%),且各类型对的学习均不显著。实验2c进一步移除时间连贯性(i.i.d.条件),学习效果最差(整体M=52.3%),且不显著。方差分析显示实验主效应(F(2,215)=3.22, p=0.042)和配对类型主效应(F(2,430)=3.74, p=0.025)显著。结果表明,时间连贯性,尤其是由动画提供的感知运动线索,能显著增强空间统计学习,且学习效果并非简单地由局部空间共现统计的强度决定。
为检验从纯时间统计到静态空间结构的完全泛化能力以及全局运动与遮挡偏倚的交互,研究人员进行了实验3a和3b。实验3a(Temporal + Animation + Occlusion)只进行单一方向(如水平)移动,并在移动垂直方向的中排单元格上放置静态遮挡条。其结果是,平行对(与运动方向一致)仅通过时间连贯性呈现(形状先后出现在同一单元格),而垂直对(与运动方向垂直)仅通过空间共现呈现(形状同时出现但有时被遮挡),对角对则以更嘈杂的方式呈现。在标准学习测试中,参与者仅学习了平行对(M=58.2%, p=0.004, BF=23.5),而未学习垂直和对角对。在空间学习测试中,参与者对平行对表现出强烈的取向知识(选择正确取向的比率M=65.5%, p≤0.001, BF=1.0 * 105),但对垂直对却表现出显著低于几率的性能(M=36.8%, p≤0.001),表明其选择被强烈的运动方向偏倚所主导。偏倚测试进一步证实了这种整体偏倚的存在(偏向平行取向M=8.0%, p≤0.001, BF=149)。实验3b移除了动画(Temporal + Occlusion),仅保留时间结构和遮挡。结果,在所有测试中均未观察到显著的学习效果,且偏倚测试显示参与者反而偏向与遮挡条方向一致的垂直取向(M=-9.0%, p≤0.001)。这表明,仅有时空统计和高级知识不足以驱动学习,感知到的全局运动(动画)提供的感官线索对于引发与运动方向一致的偏倚并支持从时间信息中学习空间结构至关重要。
本研究通过一系列精心设计的实验,揭示了视觉统计学习(VSL)远非一个简单的、机械的记录低阶空间和时间共现统计的过程。相反,它是一个复杂的、综合的解释过程(sophisticated integrative process),能够将低阶的时空信息与各种高阶的内部偏倚(如由全局运动方向和遮挡引发的偏倚)结合起来,用以推断环境的基础底层结构(underlying structure of the environment)。研究发现,时空统计信息之间存在深刻的相互作用,时间连贯性,尤其是由动画支持的感知运动,能显著增强空间结构的学习。更重要的是,学习过程表现出显著的灵活性,纯粹的时间统计信息可用于通过内部推理来学习空间模式(实验3a)。此外,运动定义和遮挡相关的语境共同且强烈地调制了从相同视觉输入中自动学习哪些时间和空间规律性,内部偏倚不仅改变学习内容,还能积极促进与偏倚配置一致的统计的学习。
这项研究的意义在于它将VSL的概念从传统框架扩展到更接近真实世界感知的整合模型。它强调了在理解人类如何学习环境表征时,考虑时空统计的相互作用以及它们与现有知识和感知偏倚的整合至关重要。未来的研究可以在此基础上,进一步探索跨模态的统计学习、迁移学习与课程学习如何在这些过程中发挥作用,以及主动学习行为如何与环境统计和内部模型交互,从而逐步构建起人类复杂而连贯的“世界模型”。
生物通微信公众号
知名企业招聘