前颞叶神经元通过动态群体编码实现声音身份不变性表征

【字体: 时间:2025年08月31日 来源:SCIENCE ADVANCES 12.5

编辑推荐:

  为解决灵长类动物如何通过声音识别个体身份这一关键科学问题,研究人员通过fMRI引导的电生理记录技术,在猕猴前颞叶声音区(aTVA)发现神经元群体通过动态编码实现跨声学变异的声音身份不变性表征。该研究首次揭示ATL神经元通过最小化同一发声者不同叫声的神经距离,同时保持不同个体间的区分轨迹,为高阶身份识别提供神经基础,发表于《SCIENCE ADVANCES》。

  

在灵长类社会互动中,声音身份识别能力至关重要——即使面对同一人不同语调或环境噪声,我们仍能准确辨别说话者。然而,这种跨声学变异的神经机制长期悬而未决。与面部识别研究相比,声音身份编码的神经元水平证据严重匮乏。尽管功能磁共振成像(fMRI)显示人类和猕猴的前颞叶声音区(anterior temporal voice area, aTVA)对说话者身份具有适应性反应,但单个神经元如何构建抽象的身份表征仍是未解之谜。

研究团队选择猕猴模型展开突破性探索。这种非人灵长类具有与人类相似的声音识别能力,其前颞叶(anterior temporal lobe, ATL)作为多模态信息整合枢纽,可能是实现高阶身份表征的关键脑区。通过结合功能定位与单神经元记录技术,科学家们首次揭示ATL神经元群体如何通过"求同存异"的动态编码策略,解决声音识别中的核心矛盾——既要忽略同一人发声的声学变异(Recognition),又要强化不同人之间的区分(Discrimination)。

关键技术方法包括:1)fMRI引导的慢性电极阵列植入,精准定位两只猕猴的aTVA;2)25种自然叫声刺激(5个体×5种"coo"叫声)结合纯音检测任务;3)时间解析的群体解码、主成分分析和表征相似性分析;4)基于ROC曲线和偏好指数(PI)的神经元分类。

aTVA神经元展现强身份选择性

研究发现70%的ATL神经元具有声音选择性(voice-selective),其中高身份选择性神经元(PI>0.8)对特定个体表现出跨叫声的稳定响应。ROC分析显示53%的神经元能不变地区分偏好身份(AUC>0.01),且选择性强度与不变性程度显著相关(rho=0.52)。

群体水平的声音身份编码

机器学习解码在刺激呈现100ms时达到88%准确率。降维分析显示,同一身份的神经轨迹在三维主成分空间快速收敛,而不同身份轨迹保持分离(P<0.0001)。值得注意的是,被声音抑制的神经元群体同样贡献身份信息,挑战了传统兴奋性编码的认知。

分布式编码优于稀疏编码

虽然高选择性神经元(如PI>0.8的"祖母细胞")携带更强身份信息,但低选择性神经元群体仍实现显著高于随机的解码性能(峰值80ms达75%)。表征相似性分析(RSA)证实,身份信息广泛分布于群体活动中,而非依赖少数特化细胞。

识别优先于区分的神经机制

时间解析RSA揭示关键发现:神经表征在20ms即开始压缩同一身份的神经距离(Recognition),而扩大不同身份距离(Discrimination)的效应延迟至90ms出现。这种"先求同后存异"的模式在控制声谱特征(LTAS)后依然存在,表明ATL优先构建抽象身份表征。

这项发表于《SCIENCE ADVANCES》的研究确立了ATL作为声音身份处理的关键枢纽。其创新性体现在三方面:首先,首次在单神经元水平证明ATL具备跨声学变异的不变性编码能力,与面部识别的"视角不变性"形成完美类比;其次,揭示分布式群体编码与特异性神经元协同工作的混合机制;最后,提出"识别优先"的时序模型,为理解社会认知的神经基础提供新框架。

该发现对神经退行性疾病(如语义性痴呆)研究具有启示意义——ATL损伤常导致熟悉感丧失和人物识别障碍。未来研究需探索跨模态(如声音-面孔)身份整合是否也发生在该脑区,以及这种编码机制在更复杂社会场景中的适应性变化。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号