综述:统计学习:发展层级中的核心机制
【字体:
大
中
小
】
时间:2025年10月10日
来源:Current Opinion in Neurobiology 5.2
编辑推荐:
本综述系统梳理了统计学习(Statistical Learning, SL)领域三十年来的研究进展,强调其作为一种无需即时奖励或反馈(unsupervised learning)的核心学习机制,在语言等复杂知识获取中的关键作用。文章深入探讨了其心理语言学根源、计算与认知神经机制(cognitive neuroscience),并指出进化与学习偏见的约束性,同时倡导通过早期发育研究来解析其神经基础组件。
所有物种的大脑,从蜜蜂[1]到鸟类[2]再到灵长类[3],都必须从其环境中获取信息并存储知识,以高效地指导未来的行为。信息获取的过程在不同情境下差异巨大。在一个极端是社会化的情境,由教师指导新手学习者,通过提供明确的反馈来传递信息的正例与反例。另一个极端则没有教师、没有反馈、也没有即时后果。无论情境如何,天真的学习者都面临着通过进化偏见和学习约束的某种组合来筛选相关信息、过滤无关信息的挑战。
研究学习的经典范式是将动物置于实验控制之下,即让动物处于实验者能精确知晓哪些自变量正在影响其行为的情境中。操纵动物行为的一个强大工具是奖励(无论是正向还是负向),因为与观察经常部分混淆的多个变量的效应相比,给定自变量的因果作用可以更快、更明确地得到确认。因此,在过去一个世纪里,奖励情境下的学习——强化学习(reinforcement learning)——一直是实验心理学和神经科学的主导范式[4]。
然而,毫无疑问,有大量的学习发生在控制较差的情境中,其中奖励要么缺失,要么无关紧要。例如,觅食的大黄蜂会对其周围环境进行初步勘察,这样一旦发现丰富的花粉源,它们就能高效地返回蜂巢并将该信息传递给同伴[5]。这种初步的空中勘察没有提供即时奖励。暴露于父亲歌声(母亲不鸣唱)的雌性斑胸草雀雏鸟从不鸣唱那种歌曲,然而这些天真的学习者获得了此歌曲模板的知识,以便数月后成熟时,能够与同种雄性交往和交配[6]。观察到年长黑猩猩使用木棍从地下巢穴捕捉白蚁的未成年黑猩猩,能够模仿这种工具使用来自行觅食白蚁,尽管在观察学习期间没有即时奖励[7]。因此,在所有物种的自然生态 across different contexts 中,无监督学习(unsupervised learning)是获取知识并部署该知识来解决特定任务的强大机制。监督学习与无监督学习的关键区别在于,前者依赖于来自环境的反馈——通过奖励和/或标记输入——而后者则在没有任何一种反馈的情况下从环境中提取结构[8]。
研究无监督学习在人类中作用的一个合适领域是语言获得(language acquisition)——一个复杂的声音(或手势)系统,用于在人与人之间传递信息。语言中的信息是层级式组织的,声音元素(音素,phonemes)被组合成传达意义的单词(以及作为单词组成部分的词素,morphemes),这些单词既可以单独使用,也可以根据一套称为语法或句法(grammar or syntax)的排序规则与其他单词组合[9]。由于研究婴幼儿的固有限制,我们对语言学习的了解大多基于对父母语言输入和儿童语言产出的自然观察[10,11]。经典研究已证实,强化学习并非儿童获得母语的主要方式——父母很少在孩子犯语法错误时提供负面反馈[12],尽管对婴儿发声的即时社会反应可以塑造其语音产出,以匹配父母言语的特性[13]。此外,儿童仅仅通过聆听周围环境中的语音,就能在12月龄前获得其母语的音位范畴[14]。因此,人们长期假设人类必须通过仅仅接触——换言之,通过无监督学习——来获得语言,尤其是在语言学习的早期阶段。然而,尚不清楚婴儿能执行何种无监督语言学习任务,以及婴儿能够追踪的信息的性质和复杂性。
1990年代初,我们的团队(Jenny Saffran, Elissa Newport, Richard Aslin)开始对8个月大的婴儿进行无监督学习测试[15]。大约在这个年龄,婴儿必须开始解决语言学习中的一个关键问题:当面临流畅的多词言语时,确定一个单词在哪里结束,下一个单词在哪里开始。这不是一个简单的任务,因为在单词边界没有可靠停顿或其他声学标记[16]。此外,解决这个单词分割任务的简单低阶解决方案,例如对音节之间的沉默或特定音节的重读做出反应,已被证明是不够的[17]。
我们假设婴儿可能对音节序列中的统计结构敏感。具体来说,我们假设一个单词内的音节序列(例如,“pretty”中的“pre”和“ty”)比跨越单词边界的音节序列(例如,“pretty baby”中的“ty”和“ba”)具有更高的转移概率(transitional probability)。为了测试这个假设,我们创造了一种由三个无意义单词(“tupiro”, “golabu”, “bidaku”)组成的微型人工语言,这些单词被拼接成连续的语音流,单词之间没有停顿。在短短2分钟的暴露期内,8个月大的婴儿聆听这种语音流。然后,我们测试了他们区分这些“单词”(高内部转移概率的音节序列)与“部分单词”(由单词末尾和下一个单词开头组成的序列,具有低转移概率)的能力。使用习惯化-去习惯化(habituation-dishabituation)范式,我们发现婴儿对部分单词的聆听时间显著长于对单词的聆听时间,表明他们检测到了单词是连贯单元,而部分单词则是新颖的、违反了他们刚刚接触到的统计规律[15]。
这一发现表明,婴儿是高效的计算者,能够追踪听觉输入中的统计规律,并利用这些规律来解析(parse)连续的语音流。后续研究很快表明,这种统计学习能力不仅限于语音,也适用于音调序列[18],并且这种能力在生命最初几个月就已出现[19]。重要的是,统计学习也被证明在语言获得的其他方面发挥作用,例如语法模式学习[20]和词汇-指称映射[21]。
我们最初的婴儿统计学习结果[15]在过去30年被引用了超过7700次,并催生了大量扩展和澄清研究。元素的时间排序从语音音节扩展到视觉物体[28],视觉物体在空间上被聚类以定义场景[29],从而将时间转移概率的重要性扩展到空间条件概率(conditional probabilities in space)。其他研究重新审视了Hayes和Clark的音调工作,发现统计学习也适用于非语言听觉刺激[30]。这些发现共同表明,统计学习是一种领域通用(domain-general)的学习机制。
然而,随着研究的深入,对统计学习的解释也变得更加细致。最初,统计学习主要与转移概率和条件概率的计算联系在一起。但后来发现,学习者也对其他类型的统计信息敏感,例如频率和变异性[31]。此外,统计学习并非完全无约束;进化偏见和学习历史都会塑造学习的结果[32]。例如,婴儿更倾向于学习符合其母语语音和韵律模式的模式[33]。
另一个挑战在于阐明统计学习的神经机制。早期功能性磁共振成像(fMRI)研究表明,统计学习涉及一个包括前额叶皮层、颞叶皮层和基底节(basal ganglia)在内的分布式网络[34]。然而,这些区域的具体贡献以及它们如何相互作用仍不清楚。例如,前额叶皮层可能与规则的抽象表征有关[35],而基底节可能涉及序列学习和时间预测[36]。
那么,解开大脑不同子成分在统计学习中所扮演角色的合理前进道路是什么?我们的观点是,关注发展(development)将是解决这个问题的特别富有成果的途径。成熟的学习者已经获得了极其复杂的学习系统,这些系统如此高效,以至于在行为层面上很难剖析其潜在机制。即使在神经层面上,成熟大脑中并行交互回路之间的复杂相互作用也使得识别特定子成分对任何给定学习任务的贡献变得困难。
相比之下,发育中的大脑提供了一个独特的机会来观察这些学习系统是如何形成的。不成熟的神经系统,其回路仍在发展且效率较低,更易于检查其潜在组件。通过研究统计学习在生命最初几天、几周和几个月内是如何展开的,我们可以开始绘制支持这种基本学习形式的神经基质图。例如,纵向脑电图(EEG)研究可以追踪与统计学习相关的事件相关电位(ERPs)随时间的变化,从而揭示其神经基础的发展轨迹[37]。同样,婴儿神经影像学(infant neuroimaging)的最新进展,如功能性近红外光谱(fNIRS),为了解发育中的大脑在执行统计学习任务时的功能组织提供了窗口[38]。
最终,通过将行为测量与发育神经科学工具相结合,我们有望更深入地理解统计学习——这一支撑着从语言获得到社会认知等众多人类能力的核心机制——是如何在大脑中实现的。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号