个体头部相关传输函数增强对掩蔽效应下语音空间释放的影响

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Healthcare and Rehabilitation》：The impact of individual head-related transfer function augmentation on spatial release from masking

【字体：大中小】 时间：2025年08月21日 来源：Healthcare and Rehabilitation

编辑推荐：

　　研究探索个体头相关传递函数（HRTF）的跨耳增强对语音掩蔽释放（SRM）的影响，比较了Durlach和Pang原始算法与改进版算法在11名听者中的效果，发现增强方法提升语音可懂度但对SRM无显著改善，模型预测与实际结果存在差异，提示听者对自身空间线索的熟悉度可能影响效果。

　　人类的双耳听觉系统在复杂声音环境中起着至关重要的作用，它通过增强听者对同时发生的声音源进行分离的能力，从而支持有效的交流。在某些特定条件下，通过放大双耳之间的线索（如相位差和强度差）可以显著提高语音在背景噪声中的可懂度。然而，目前大多数方法主要依赖于助听器算法，这些算法由于处理限制，往往会产生不必要的听觉伪影。此外，将这种双耳线索放大直接应用于个体的头相关传递函数（HRTF）所带来的感知影响仍然不明确。

本研究重新审视了一种先前用于放大双耳线索的方法，并将其应用于个体的HRTF上，提出了一种改进版本，旨在减少空间线索的失真。我们通过使用听觉模型和涉及语音对语音掩蔽的听力测试来评估这两种方法的效果。研究结果显示，尽管放大双耳相位差和强度差能够提高语音可懂度，但并未显著增强空间掩蔽释放（SRM）。同时，听觉模型的预测结果表明，SRM的提升幅度高于实际观察到的数值，这可能与听者对自身空间线索的熟悉程度有关。此外，对于那些已经表现出较强SRM能力的听者，双耳线索的放大效果则趋于减弱。

在听觉感知领域，空间线索的识别依赖于双耳之间的时间差（ITD）和强度差（ILD），以及单耳的频谱线索。这些线索共同作用，使听者能够定位声源并分离并发的听觉流。在嘈杂环境中，这种分离能力对于提高语音可懂度尤为重要，例如在鸡尾酒会场景中，听者能够通过双耳线索更好地分辨目标语音与背景噪声。SRM作为一种关键机制，利用了更好耳的信噪比（SNR）和双耳线索带来的听觉解掩蔽（BU）效应，从而提升语音识别能力。

HRTF作为描述个体听觉系统对声音传播路径影响的重要工具，包含了双耳和单耳的频谱线索，能够准确反映每个听者的形态学滤波特性。因此，HRTF被广泛用于模拟虚拟听觉环境。然而，尽管HRTF被认为是实现准确空间化不可或缺的元素，但个体HRTF在实际应用中并不总是能带来最佳的感知效果。这可能是因为直接测量个体HRTF的复杂性，使得许多应用仍然依赖于非个体化的HRTF。已有研究表明，某些非个体化的HRTF（如KEMAR HRTF）在特定场景下可能优于个体化的HRTF，这表明HRTF的选择对SRM有重要影响。

进一步的研究发现，SRM的差异不仅仅由空间线索的大小决定，还可能受到听者对自身空间线索的熟悉程度的影响。例如，Cuevas-Rodriguez等人（2021）在虚拟鸡尾酒会场景中进行了一项语音在噪声中的研究，结果显示，不同HRTF对语音接收阈值（SRT）的影响存在显著的个体差异。一些参与者在使用特定HRTF时表现出可测量的SRM提升，而另一些则显示出性能下降。这一结果表明，尽管某些HRTF在理论上可能提供更优的空间线索，但实际效果仍取决于听者对这些线索的熟悉程度。此外，González-Toledo等人（2024）的研究也发现，个体HRTF在中平面SRM任务中表现出显著优势，尤其是在非母语英语使用者中，这种优势更为明显。

综上所述，SRM的提升不仅依赖于空间线索的大小，还可能受到听者对自身空间线索的熟悉程度的影响。因此，研究如何通过修改个体HRTF来增强SRM具有重要意义。已有的一些HRTF增强策略，如频谱增强、双耳相位差（IPD）放大、频率选择性放大、基于感知的HRTF调整以及频率缩放等，主要关注于定位准确性，而非SRM的提升。其中，Pirhosseinloo和Kokkinakis（2016）提出了一种基于双耳线索放大的算法，但并未进行直接的感知评估，因此其对SRM的具体影响仍需进一步验证。

本研究旨在探索是否可以通过直接修改个体HRTF来提升SRM。我们采用了De Taillez等人（2018）提出的基于助听器的IPD和ILD放大的方法，并将其应用于个体HRTF而非混合后的双耳信号。此外，考虑到传统助听器算法设计中常见的基于窗口的双耳流处理限制，我们提出了一种改进的IM算法，结合了ITD和ILD放大，以减少空间线索的扩散效应。为了评估这种修改后的IM方法的效果，我们进行了语音对语音掩蔽的听力测试，共有11名参与者参与，测试了三种空间条件下的SRM表现：（1）原始个体HRTF；（2）采用Durlach和Pang（1986）方法的IM处理；（3）采用我们改进的IM方法。测试结果表明，尽管IM处理在一定程度上提升了语音可懂度，但并未显著增强SRM。此外，我们的研究还发现，基于ITD和ILD的IM方法相比仅基于IPD和ILD的方法，能够减少空间线索的扩散，从而更有效地保留听觉系统对声源位置的感知能力。

从听觉模型的预测结果来看，C2（基于IPD和ILD的IM处理）在某些角度下表现出比C3（基于ITD和ILD的IM处理）更高的SRM。然而，实际的听力测试结果显示，C2虽然在语音可懂度上有所提升，但并未显著增强SRM。这一结果表明，尽管模型能够预测SRM的提升，但实际效果可能受到听者对自身空间线索的熟悉程度的限制。此外，研究还发现，个体HRTF的SRM优势可能与长期适应自身空间线索的能力有关，这种适应可能在某些情况下弥补了空间线索的不足。

本研究的结果对于听觉辅助设备的设计和优化具有重要意义。传统的助听器算法通常依赖于非个体化的HRTF，而这些算法在某些情况下可能无法充分发挥SRM的潜力。通过直接修改个体HRTF，可以更精确地调整空间线索，从而可能提高SRM的效果。然而，研究也表明，这种改进的效果可能因个体而异，且在某些情况下可能并不显著。因此，未来的研究需要进一步探索如何在不引入听觉伪影的前提下，优化HRTF的修改策略，以实现更有效的SRM提升。

此外，本研究还发现，某些听觉模型的预测结果与实际的听力测试结果存在差异，这可能意味着模型未能完全捕捉到听者对自身空间线索的熟悉程度这一关键因素。因此，未来的研究应考虑将这一因素纳入模型的预测中，以更准确地评估HRTF修改对SRM的影响。同时，研究还指出，尽管某些HRTF在理论上可能提供更优的空间线索，但实际效果仍需通过个体化的感知测试来验证。

综上所述，本研究通过直接修改个体HRTF来探索SRM的提升可能性，发现虽然IM处理在一定程度上提高了语音可懂度，但并未显著增强SRM。此外，基于ITD和ILD的IM方法相比基于IPD和ILD的方法，能够减少空间线索的扩散，从而更有效地保留听觉系统对声源位置的感知能力。这些发现为未来的听觉辅助设备设计提供了重要的参考，同时也揭示了听者对自身空间线索的熟悉程度在SRM中的重要作用。未来的研究应进一步探索如何在不引入听觉伪影的前提下，优化HRTF的修改策略，以实现更有效的SRM提升。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号