言语交流的神经机制与沟通目标：从内部感觉目标到社会互动的整合

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月06日 来源：Journal of Neurolinguistics 1.2

编辑推荐：

　　本研究针对传统语音运动控制模型（如DIVA、FACTS）忽视社交语境的问题，通过整合神经计算模型与语言学证据，揭示了人类言语生产兼具内部感觉目标（听觉/体感反馈）和外部沟通目标（如社会联结）。研究提出语音变异性是社交语音的固有特征，为构建更自然的交互式语音生产模型提供了理论框架，对神经语言学及人机交互领域具有重要启示。

在人类复杂的社交行为中，言语交流如同精密编排的交响乐——既要精准控制发音器官的肌肉运动，又需实时适应对话者的反应。然而，现有神经科学模型（如DIVA、FACTS）将语音生产简化为"黑暗中的独白"，仅关注内部听觉和体感目标的匹配，却忽视了言语本质上是"照亮他人的社交火炬"。这种割裂在Royal Society Dorothy Hodgkin Fellow Sophie Meekings与伦敦大学学院Sophie K. Scott的合作研究中被打破，其发表于《Journal of Neurolinguistics》的论文首次系统整合了神经机制与社交语境的双重视角。

研究团队采用多学科交叉方法，通过分析听觉反馈扰动实验（如实时音高偏移技术）、体感干扰研究（如口腔触觉刺激），以及自然对话中的语音协调现象（如对话者的发音趋同），构建了"双目标驱动"理论框架。特别值得注意的是，他们创新性地引入灵长类动物动作控制神经机制作为跨物种证据，为模型优化提供了生物学基础。

内部目标：反馈控制的神经基石
通过梳理DIVA模型的反馈环路机制，研究证实人类通过比较实际发音与内部存储的音节模板（如/sup>ɑ/^{的声学特征）进行实时纠错。当实验者人为延迟听觉反馈时，受试者前运动皮层会出现特征性N1-P2脑电波，证明听觉目标监控的神经基础。然而，体感反馈研究（如Lametti等人2012年的舌位扰动实验）显示，发音器官位置信息的纠错速度比听觉反馈快30%，提示不同感觉通道存在分级处理机制。}

外部目标：社交语境的调控魔力
当研究视角转向真实对话场景，数据呈现颠覆性发现：在儿童语言发展研究中（Hazan et al., 2015），母亲会无意识调整元音清晰度以适应婴儿的感知能力；而商务谈判录音分析显示，对话双方在15分钟内会出现基频收敛现象（Tuomainen et al., 2022）。这种"语音舞蹈"现象无法用传统内部目标模型解释，却符合Pickering & Garrod（2013）提出的互动对齐理论——人类会优先保证社交和谐而非发音精准。

职业困境：实验范式的桎梏
论文尖锐指出当前研究的三大局限：fMRI静音扫描无法捕捉动态对话、实验室隔离环境消除社交线索、大多数研究仅采集单方语音。这导致关键发现如Niziolek等人（2013）的"听众效应"（说话者听到自己声音时会激活不同于独白时的颞顶联合区）长期被模型忽视。

神经框架革新：迈向社交语音生产模型
基于灵长类镜像神经元研究，作者提出扩展的"预测-评估-调整"三级架构：初级运动皮层执行发音动作时，前扣带回皮层同步评估社交意图达成度，而颞上沟负责整合对话者的非语言反馈。当社交评估（如听众困惑表情）与听觉反馈冲突时，健康成人会优先调整发音策略——这一现象在自闭症谱系群体中恰好相反，为临床诊断提供了新思路。

这项研究的意义远超学术领域：在理论层面，它弥合了神经科学与语言学长达数十年的鸿沟；在应用层面，为开发具有真实对话能力的AI语音系统指明了方向。正如作者强调的，未来研究必须突破"无菌实验室"的束缚，在自然交互中解码人类语音的社交密码——因为真正的言语艺术，永远诞生于两颗心灵的交响共鸣之中。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号