
-
生物通官微
陪你抓住生命科技
跳动的脉搏
序列统计学习的特异性:统计学习从非结构化输入中积累预测信息但与词汇(陈述性)记忆可分离
【字体: 大 中 小 】 时间:2025年05月06日 来源:Cognition 2.8
编辑推荐:
研究人员针对统计学习(Statistical Learning, SL)在语言习得中的作用机制展开研究,通过计算建模和行为实验揭示了SL的核心功能是积累分布信息而非形成词汇的陈述性记忆。实验表明,在连续语音序列中,82%的受试者无法回忆高概率词汇项,且SL仅在连续序列中有效,与离散组块处理机制分离。该研究为理解语言习得的认知神经机制提供了新视角,挑战了传统SL理论框架。
语言习得过程中,婴儿如何从连续的语音流中识别词汇边界一直是认知科学的核心问题。传统理论认为统计学习(SL)通过计算音节间过渡概率(TP)自动切分词汇并形成记忆,但这一假设缺乏直接证据。随着研究发现SL可能仅支持预测加工而非记忆编码,以及实际语言输入中存在韵律分组的离散性特征,SL在词汇习得中的真实作用亟待厘清。
为解答这一争议,国外研究团队在《Cognition》发表研究,通过计算建模结合行为实验系统评估SL的功能边界。研究首先构建Hebb神经网络模型,模拟单元与子单元的识别偏好;随后开展两项实验:实验1采用Saffran经典词汇切分范式,要求受试者回忆连续/预分割语音序列中的词汇;实验2操纵TP分布模式,测试受试者对连续/离散序列中高频组块的敏感性。关键技术包括:(1)基于mbrola语音合成器构建人工语言材料;(2)在线/实验室结合的回忆与识别测试;(3)基于TP计算的响应模式分析;(4)使用PARSER模型验证组块理论。
统计学习vs词汇记忆的神经模拟
通过Hebb网络复现Giroux & Rey(2009)的单元优势效应,证明抑制性连接可解释单元偏好,无需依赖记忆编码。模型显示A-C连接强度低于A-B/B-C连接,导致子单元激活受抑制。
实验1:连续序列中的记忆缺失
关键发现包括:(1)连续序列组仅30%受试者能回忆词汇/部分词汇,其中正确回忆词汇者仅占半数;(2)预分割组回忆准确率达92.3%;(3)TP敏感性与回忆表现分离,显示SL不自动转化为陈述性记忆。神经网络分析表明PARSER模型无法解释部分词汇回忆现象。
实验2:序列连续性的调节作用
英国语音版本显示统计学习在连续序列中显著(58.5%正确率,p<0.02),但在预分割序列中失效(51.7%,p=0.307)。美国语音版本重复验证该效应,证实SL对序列结构的依赖性。
研究结论挑战了SL作为词汇习得基础的传统观点:(1)SL通过Hebb机制积累TP信息,但不会自动形成可回忆的词汇表征;(2)离散韵律分组阻碍SL效应,而连续序列促进预测加工;(3)词汇记忆依赖明确的边界线索而非统计规律。该发现为语言习得理论提供新框架,提示婴儿可能优先利用韵律等非统计线索建立词汇库,而SL主要支持流利语音的实时预测。研究还启示第二语言教学应注重词汇的离散呈现,并重新评估SL在神经发育障碍干预中的应用策略。
生物通微信公众号
知名企业招聘