
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于耳蜗启发的传感内计算技术实现高效语音识别:仿生弹性超材料的物理储备计算系统
【字体: 大 中 小 】 时间:2025年08月20日 来源:Advanced Intelligent Systems 6.1
编辑推荐:
这篇综述创新性地提出了一种受耳蜗(cochlea)启发的螺旋形弹性超材料传感器,通过物理储备计算(PRC)实现传感内计算(in-sensor computing)。该设备将声波信号直接转换为时空特征图(tonogram),替代传统语音识别中的数字预处理(如MFCCs),在保持高分类准确率的同时显著降低能耗与延迟,为物联网(IoT)和边缘人工智能(edge AI)提供了新型硬件解决方案。
传统语音识别依赖软件算法(如MFCCs)进行特征提取,存在高延迟与能耗问题。随着物联网(IoT)设备数量激增(预计2030年达300亿台),亟需突破冯·诺依曼架构限制。生物感官系统(如耳蜗)通过物理层面的信号处理实现高效感知,为硬件设计提供了新思路。
研究团队开发了一种螺旋形弹性超材料传感器,其几何参数(rC(θ)=r0ekrθ/θmax)通过主动集算法优化,实现100 Hz–10 kHz声波的频率-空间映射(tonotopy)。实验显示,190 Hz与880 Hz声波激发时,振动峰值分别位于螺旋结构的外圈与内圈(图1e-f),与有限元模拟结果一致。
16个压电传感通道沿螺旋中心线分布,将声波信号转换为16×16时空特征图(tonogram)。例如单词"zero"的时域信号经传感器处理后,各通道功率分布形成独特模式(图2c)。这种物理层面的处理避免了数字算法的复杂运算,直接生成类耳蜗的频谱特征。
基于audioMNIST数据集的测试表明,tonogram的t-SNE可视化呈现明显类别聚类(图3b),效果媲美MFCCs和Lyon耳蜗图。线性分类器在3000个样本中实现高准确率,验证了硬件预处理的有效性。仿真扩展实验显示,该方法可覆盖完整数据集(30,000样本),适用于边缘设备。
该技术突破传统声学传感器的被动检测模式,将特征提取与传感融合于单一物理载体。未来可应用于助听器、智能家居等低功耗场景,为生物启发计算(bioinspired computing)开辟新路径。
生物通微信公众号
知名企业招聘