基于耳蜗启发的传感内计算技术实现高效语音识别:仿生弹性超材料的物理储备计算系统

【字体: 时间:2025年08月20日 来源:Advanced Intelligent Systems 6.1

编辑推荐:

  这篇综述创新性地提出了一种受耳蜗(cochlea)启发的螺旋形弹性超材料传感器,通过物理储备计算(PRC)实现传感内计算(in-sensor computing)。该设备将声波信号直接转换为时空特征图(tonogram),替代传统语音识别中的数字预处理(如MFCCs),在保持高分类准确率的同时显著降低能耗与延迟,为物联网(IoT)和边缘人工智能(edge AI)提供了新型硬件解决方案。

  

引言

传统语音识别依赖软件算法(如MFCCs)进行特征提取,存在高延迟与能耗问题。随着物联网(IoT)设备数量激增(预计2030年达300亿台),亟需突破冯·诺依曼架构限制。生物感官系统(如耳蜗)通过物理层面的信号处理实现高效感知,为硬件设计提供了新思路。

仿生传感器设计

研究团队开发了一种螺旋形弹性超材料传感器,其几何参数(rC(θ)=r0ekrθ/θmax)通过主动集算法优化,实现100 Hz–10 kHz声波的频率-空间映射(tonotopy)。实验显示,190 Hz与880 Hz声波激发时,振动峰值分别位于螺旋结构的外圈与内圈(图1e-f),与有限元模拟结果一致。

硬件特征提取机制

16个压电传感通道沿螺旋中心线分布,将声波信号转换为16×16时空特征图(tonogram)。例如单词"zero"的时域信号经传感器处理后,各通道功率分布形成独特模式(图2c)。这种物理层面的处理避免了数字算法的复杂运算,直接生成类耳蜗的频谱特征。

语音识别性能验证

基于audioMNIST数据集的测试表明,tonogram的t-SNE可视化呈现明显类别聚类(图3b),效果媲美MFCCs和Lyon耳蜗图。线性分类器在3000个样本中实现高准确率,验证了硬件预处理的有效性。仿真扩展实验显示,该方法可覆盖完整数据集(30,000样本),适用于边缘设备。

应用前景

该技术突破传统声学传感器的被动检测模式,将特征提取与传感融合于单一物理载体。未来可应用于助听器、智能家居等低功耗场景,为生物启发计算(bioinspired computing)开辟新路径。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号