认知能力能否预测鸡尾酒会场景下言语识别的个体差异?

【字体: 时间:2025年06月24日 来源:Hearing Research 2.5

编辑推荐:

  【编辑推荐】本研究针对认知功能在复杂声环境(如鸡尾酒会)中影响言语识别的理论争议,通过控制年龄和听力损失等混杂因素,首次在稳态噪声和双人语音背景(two-talker babble)下同步测量50名正常听力青年受试者的言语识别与认知表现(选择性注意、数字广度)。结果发现,认知表现对噪声中言语识别无显著贡献(r2=0–11%),但可解释26–68%的语音背景下的个体差异,尤其在认知任务与言语测试同处于语音背景时预测力最强。该研究为认知-听觉交互机制提供了直接证据,对助听设备开发和临床评估具有重要启示。

  

在喧嚣的社交场合中,人类大脑能神奇地聚焦特定对话,这一现象被称为"鸡尾酒会问题(cocktail party problem)"。尽管人工听觉系统在安静环境中表现优异,但面对复杂声环境时仍举步维艰——无论是自动语音识别系统还是助听设备,都难以复现人脑的卓越表现。更令人困惑的是,即使在正常听力人群中,个体在嘈杂环境中的言语识别能力也存在巨大差异。传统理论认为认知功能(如选择性注意和工作记忆)是关键因素,但实证研究却长期受困于年龄、听力损失等混杂因素干扰,且认知测试多在安静环境下进行,与实际声环境严重脱节。

针对这一科学难题,加州大学欧文分校的研究团队设计了一项创新性实验。他们招募50名听力正常的年轻受试者(23.5±4.6岁),通过严格控制实验条件,首次在稳态噪声和双人语音背景(two-talker babble)两种声环境下同步测量言语识别阈值(SRT)与认知表现(选择性注意、数字广度任务)。为避免能量掩蔽(energetic masking)干扰,研究者采用分耳呈现技术——认知测试刺激与背景噪声分别输入不同耳朵。这项发表于《Hearing Research》的研究揭示了认知与听觉交互的新机制。

关键技术包括:1)双耳分频刺激技术(认知任务单耳呈现,背景噪声对侧耳);2)自适应言语识别阈值测量法;3)跨模态认知评估(选择性注意、数字广度任务)在三种声环境(安静、稳态噪声、双人语音)下的实施;4)采用年轻正常听力人群队列排除年龄和听力损失干扰。

【言语识别在语音背景下的变异性高于噪声】
研究发现,双人语音背景下的言语识别个体差异是稳态噪声环境的三倍(图1)。平均言语识别阈值(SRT)在噪声中为-0.2 dB,而在语音背景下显著改善至-4.4 dB,这种差异可能与语音背景提供的时间-频谱线索(temporal-spectral cues)有关。

【语音背景特异性损害认知功能】
与传统认知测试环境不同,研究发现稳态噪声不影响认知表现,但双人语音背景会显著降低选择性注意和数字广度任务成绩(图2)。这种背景特异性效应提示,认知资源可能被语音中的语言学信息竞争所占用。

【认知预测力的环境依赖性】
相关分析和多元线性回归显示(表3,图3-4),认知表现对噪声中言语识别的预测力有限(r2=0–11%),但对语音背景下识别率的解释度达26–68%。最具预测力的模型出现在认知测试与言语识别同处语音背景时,支持"环境匹配增强预测效度"的假设。

【结论与意义】
该研究首次在控制年龄和听力损失的前提下证实:1)语音背景比噪声产生更大的言语识别变异性;2)认知损伤具有声环境特异性;3)认知贡献度取决于测试环境匹配程度。这些发现革新了对"鸡尾酒会问题"的认知——当声环境包含竞争性语音信息时,高级认知功能(如选择性注意)成为决定个体表现的关键因素。研究为开发新一代助听算法(如基于认知状态的动态降噪策略)提供了理论依据,同时提示临床听力评估需结合生态效度更高的认知测试环境。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号