
-
生物通官微
陪你抓住生命科技
跳动的脉搏
词汇与构式概率如何解释长距离依存结构的可接受性
【字体: 大 中 小 】 时间:2025年07月26日 来源:Cognition 2.8
编辑推荐:
研究人员针对长距离依存结构可接受性的影响因素展开研究,通过概率模型验证了动词框架概率(P(verb, that))及其分解因素(动词概率P(verb)和条件概率P(that | verb))的关键作用。实验复现和扩展研究表明,句子可接受性与词汇及构式的整体概率显著相关,为句法理论争议提供了基于语料库的量化证据,支持构式语法(Construction Grammar)的认知解释。
语言科学中一个长期悬而未解的谜题是:为什么某些跨越句子补语动词的长距离依存结构(如“What did Mary murmur that Bill kicked?”)听起来别扭,而另一些(如“What did Mary say that Bill kicked?”)却显得自然?传统句法理论试图通过复杂的空语类(empty categories)或“句法岛屿”假说来解释,但这些假设缺乏独立证据支持。近年来,认知语言学提出概率模型可能才是关键——人们更接受那些由高频词汇和常见构式组成的句子。
为验证这一假说,麻省理工学院(Massachusetts Institute of Technology, MIT)的研究团队在《Cognition》发表论文,通过语料库分析和行为实验双重验证。他们首先从美国当代英语语料库(COCA)中提取动词概率P(verb)、动词带补语连词that的条件概率P(that | verb),以及二者乘积的动词框架概率P(verb, that)。随后复现Liu et al. (2022)的实验设计,让受试者对48组含不同动词的疑问句和陈述句进行可接受性评分,并新增形容词框架(如“What was Mary glad that Bill bought?”)的扩展研究。
关键技术方法
主要研究结果
动词框架概率的分解效应:
形容词框架的平行验证:
构式类型的主效应:
结论与意义
这项研究通过概率视角统一解释了句法理论长期争论的“岛屿效应”:句子的可接受性并非由抽象句法规则决定,而是取决于其组成成分的累积概率。这一发现为构式语法(Construction Grammar)提供了实证支持,表明语言处理本质上是基于经验的概率计算过程。方法论上,研究创新性地将语料库概率分解为可解释的认知变量,为后续研究提供了可复用的分析框架。实际应用中,该模型可优化自然语言处理系统对“非标准”句子的生成与评估策略。
生物通微信公众号
知名企业招聘