自然语言处理模型揭示人类对话中神经动态的奥秘

【字体: 时间:2025年04月10日 来源:Nature Communications 14.7

编辑推荐:

  编辑推荐:本研究通过结合预训练深度学习自然语言处理(NLP)模型与颅内神经元记录,首次揭示了自然对话中语言生成与理解的神经机制。研究发现,前颞叶广泛分布的神经活动通过多频带协同编码词汇与句子信息,且部分神经模式在说话者-听者转换时动态对齐。该成果为理解人类语言交流的神经基础提供了全新视角,发表于《Nature Communications》。

  

人类对话是信息传递的核心方式,但大脑如何动态协调语言生成(speech production)与理解(speech comprehension)的神经机制仍是未解之谜。传统研究受限于实验设计的简化(如预设句子或单向任务),难以捕捉自然对话中快速角色转换(turn-taking)和上下文依赖的神经活动。此外,现有技术如功能磁共振成像(fMRI)缺乏毫秒级时间分辨率,而脑电图(EEG)又难以定位深层脑区。这些局限促使研究人员探索更接近真实交流场景的研究范式。

来自美国哈佛医学院等机构的研究团队通过颅内脑电图(sEEG)记录14名癫痫患者的神经活动,结合预训练自然语言处理(NLP)模型(如GPT-2和BERT),首次揭示了自然对话中语言处理的动态神经编码。研究发现,语言信息通过前颞叶广泛网络的多频带(尤其是70-110 Hz中频伽马波段)协同表征,且神经活动与NLP模型的高层语义嵌入(embedding)显著相关。该成果发表于《Nature Communications》,为理解人类语言交互的神经基础提供了突破性证据。

研究团队运用了以下关键技术:

  1. 颅内记录:通过植入深度电极采集14名癫痫患者(6女8男,16-59岁)的局部场电位(LFP),覆盖39个脑区共1910个双极参考通道,排除癫痫样放电通道。
  2. 自然对话实验:患者与实验者进行1小时自由对话,同步记录语音和神经活动,转录并时间对齐8.6万单词。
  3. NLP模型分析:使用GPT-2和BERT模型提取词汇/句子级嵌入(768维向量),计算其与神经活动的相关性(经自相关校正)。
  4. 多频带信号处理:分析α(8-13 Hz)、β(13-30 Hz)、低/中/高频γ(30-55/70-110/130-170 Hz)波段能量。

神经活动与NLP模型的广泛关联
研究发现,左半球(尤其左前中央回和颞上回)更多通道与NLP嵌入显著相关(R=0.12±0.04),且中γ波段响应最强(11-14%通道)。这种关联在随机化神经数据或伪词任务(Jabberwocky)中消失,证实其特异性。

语言生成与理解的神经分离与重叠
虽然语言生成偏好左前中央回(21%通道),理解偏好双侧颞上回(23-25%通道),但18%通道(如海马和杏仁核)在两种任务中共享响应,提示部分神经资源可复用。

对话转换的神经标记
13%通道在听-说转换时活动显著变化(如颞上回β波抑制、γ波增强),其中39%与NLP响应通道重叠,表明转换神经机制与语言内容处理部分耦合。

NLP层级与神经表征的对应
神经活动更倾向匹配NLP模型的高层(第8层)嵌入(13%通道),反映对句子级语义而非词汇特征的编码。这一模式在被动复述任务中减弱,凸显自然对话的复杂性。

该研究通过创新性地结合颅内记录与深度学习模型,首次绘制了自然对话中语言处理的动态神经图谱。其核心发现包括:

  1. 分布式编码:语言信息通过前颞叶-边缘系统多频带网络协同表征,挑战了传统语言中枢局部化理论。
  2. 上下文依赖性:神经活动与NLP高层语义嵌入的强关联,揭示大脑对句子级语境(而非孤立词汇)的敏感性。
  3. 转换机制:听-说转换的神经动态与语言内容处理部分重叠,为对话流畅性提供机制解释。

这些发现不仅推进了对语言神经基础的理解,还为开发更自然的脑机接口(BCI)和语言障碍治疗策略提供了新靶点。未来研究可进一步探索个体差异(如左利手)和文化背景对神经编码的影响,以及跨模态(如语音-手势)交互的神经机制。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号