视觉-听觉感觉替代学习揭示图像-声音映射的灵活性
《npj Science of Learning》:Learning visual to auditory sensory substitution reveals flexibility in image to sound mapping
【字体:
大
中
小
】
时间:2025年12月05日
来源:npj Science of Learning 3
编辑推荐:
本研究针对视觉-听觉感觉替代设备(SSD)中图像-声音映射规则是否受跨模态对应关系制约的问题,通过比较传统算法(音高表示垂直位置)、反向算法(音高表示水平位置)和对照组的学习效果,发现结构化映射均可快速习得,表明SSD映射具有可塑性,为个性化康复设备开发提供新思路。
当我们闭上眼睛,世界并未消失——这是感觉替代技术带来的神奇体验。对于视觉障碍者而言,这种技术如同打开另一扇感知之窗。视觉-听觉感觉替代设备(SSD)通过将视觉信息转化为声音信号,帮助盲人"看见"周围环境。其中最具代表性的The vOICe系统,将像素的垂直位置映射为音高,水平位置映射为时间,创造出独特的"声音景观"。
然而,一个长期存在的争议是:这种映射关系是否必须遵循所谓的"跨模态对应"原则?比如高音自然对应高处,低音对应低处?还是说大脑具有足够的可塑性,能够学习任意映射规则?这个问题不仅关乎设备设计的理论基础,更直接影响康复训练的效率。
为了解答这一疑问,来自瑞士洛桑大学医院等机构的研究团队在《npj Science of Learning》上发表了一项创新研究。他们设计了一个巧妙的实验,比较三种不同的图像-声音映射规则:传统算法(音高表示垂直位置)、反向算法(音高表示水平位置)以及无结构的单音对照组。
研究采用随机分组设计,60名视力正常的成年人被分配到三个实验组。学习阶段,参与者通过系统训练掌握声音与图像的对应关系;评估阶段则测试他们对熟悉和新颖刺激的识别能力。令人惊讶的是,仅需30分钟的训练,传统算法组和反向算法组就都达到了高于随机水平的识别准确率,且两组之间没有显著差异,但都显著优于对照组。
这一发现挑战了传统观念——大脑并不固执于某种特定的跨模态对应关系,而是能够快速适应新的感知映射规则。就像学习一门新语言,只要规则一致,无论语法结构如何,大脑都能逐渐掌握。这种灵活性为个性化感觉替代设备的设计开辟了新天地,未来可以根据用户特点、任务需求定制最适合的映射算法。
关键方法包括:使用The vOICe算法生成声音景观,采用64×64像素黑白图像作为视觉刺激,设计包含学习和评估两阶段的行为实验范式,通过五选一强制选择任务测量行为表现,并利用问卷调査分析参与者的策略使用和主观体验。
研究人员分析了首次尝试的正确率,发现映射条件存在显著主效应(F(2,57)=12.81,p<0.001)。传统组正确率为90.00±1.85%,反向组为84.17±2.65%,对照组为72.08±3.02%。事后比较显示,传统组和反向组均显著优于对照组(p<0.001;p=0.004),但传统组与反向组之间无显著差异(p=0.299)。这表明结构化映射能显著促进早期学习,而映射方向本身不影响学习效果。
混合模型重复测量方差分析显示,组别主效应显著(F(2,57)=27.95,p<0.001)。传统组和反向组的正确率均显著高于对照组(p<0.001),但两组间无显著差异(p=0.189)。刺激类型主效应也显著(F(1,57)=135.03,p<0.001),熟悉刺激的正确率(60.29%)高于新颖刺激(29.83%)。组别与刺激类型的交互作用不显著,表明所有组别都表现出相似的新颖性效应。
刺激类型主效应显著(F(1,57)=98.337,p<0.001),新颖刺激的处理时间更长。组别与刺激类型的交互作用显著(F(2,57)=10.697,p<0.001),表明不同组别处理新颖刺激的时间增加幅度不同。反向组增加最多(+3.05秒),传统组次之(+2.53秒),对照组增加最少(+0.83秒)。组别主效应不显著,表明处理时间差异主要由刺激新颖性驱动。
传统组(95%)和反向组(89.5%)比对照组(85.7%)更频繁报告使用策略。在声音景观可视化能力上,传统组(65%)和反向组(78.9%)显著高于对照组(28.6%)。策略类型分析显示,音高映射(19人)和心理意象(12人)是最常用的策略。组间在错误意识、正确回答信心等指标上无显著差异。
这项研究揭示了感觉替代设备学习的重要特性——映射规则的结构性比具体方向更为关键。只要存在系统性的对应关系,大脑就能快速建立新的感知联系。这一发现对感觉替代设备的个性化设计具有深远意义。
从理论层面看,研究结果对跨模态对应理论提出了挑战。传统认为"高音-高处"的对应关系可能是基于统计规律而非神经硬连线。当提供明确的结构性映射时,学习过程可以覆盖先前的感知倾向。这与Spence和Deroy提出的观点一致,即跨模态对应具有可塑性,可通过学习进行调节。
在实践应用方面,研究证明简短、结构化的训练就能产生显著学习效果,这为感觉替代设备的临床推广提供了乐观前景。特别是对于视觉障碍者,快速掌握设备使用方法至关重要。研究发现的不同映射规则等效性,意味着可以根据具体任务(如物体识别、导航)优化算法设计。
神经机制方面,虽然行为表现相似,但不同映射规则可能涉及不同的神经处理通路。未来研究可结合脑成像技术,探索传统映射和反向映射在神经活动层面的差异,进一步揭示感觉替代的脑机制。
研究也存在一些局限性,如仅使用简单黑白刺激、训练时间较短、参与者为视力正常者等。未来研究可扩展至复杂刺激、长期训练效果评估以及视觉障碍人群的应用。
总之,这项研究为我们理解大脑的多感官整合能力提供了新视角,证明感觉替代映射具有令人惊讶的灵活性。随着进一步研究,感觉替代技术有望为视觉障碍者提供更加个性化、高效的感觉补偿方案,真正实现"用耳朵看见世界"的梦想。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号