
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于主导频率分段Conformer与域适应的声学步态身份识别方法研究
【字体: 大 中 小 】 时间:2025年06月29日 来源:Expert Systems with Applications 7.5
编辑推荐:
针对声学步态识别中服装、鞋型和房间类型干扰导致的性能下降问题,研究人员提出DFSC-DA(主导频率分段Conformer与域适应)框架,通过分段建模步态信号的周期内/间变化,结合对抗训练机制提取鲁棒特征。实验显示其在AFPID-II数据集上分类准确率最高提升6.66%,为服务机器人跟随和隐私保护场景提供关键技术支撑。
在智能监控与人机交互领域,身份识别技术长期依赖视觉模态,但隐私泄露风险与场景限制促使研究者转向声学步态这一天然非接触式生物特征。然而,当人们穿着不同鞋履、衣物或行走于各异房间时,脚步声的频谱特征会因环境混响、材质摩擦等干扰产生显著变异。现有研究表明,鞋型变化会导致识别准确率骤降34.75%,而房间类型差异更使性能跌至13.41%——这些“声学指纹”的脆弱性严重制约了该技术在服务机器人跟随、安防监控等场景的应用。
为解决这一挑战,来自国内的研究团队开发了DFSC-DA框架,其核心创新在于将声学信号的物理特性与深度学习相结合。研究采用AFPID-II数据集(含88,467步态事件),通过主导频率分段策略将原始信号分解为多尺度片段,利用Conformer(结合CNN与Transformer优势的架构)同步建模步态周期内细微震动与周期间宏观模式,再通过域适应对抗训练消除环境干扰。该成果发表于《Expert Systems with Applications》,在无干扰、服装变异和鞋型变异条件下分别提升识别精度2.03%、6.66%和3.50%。
关键技术方法
研究结果
基线实验
在AFPID-II的三种测试条件下,DFSC-DA相较基线模型显著提升性能,尤其在服装干扰场景取得6.66%的突破性改进,证实分段策略对材质摩擦噪声的鲁棒性。
消融研究
移除域适应模块后,模型在跨房间测试中准确率下降21.8%,凸显对抗训练对消除环境混响的关键作用。Conformer的周期内/间联合建模贡献了约40%的性能增益。
单变量控制实验
保持其他变量恒定,鞋型变化导致的性能衰减从传统方法的65.25%改善至61.75%,表明主导频率分段有效缓解了鞋底材质引起的频谱偏移。
结论与意义
DFSC-DA首次将多尺度时序建模与域适应结合应用于声学步态识别,其技术路线具有三重突破性:物理启发的分段策略解决了传统声学特征工程泛化性差的痛点;Conformer的时空双流架构突破了RNN在长序列建模中的瓶颈;对抗训练机制为跨环境部署提供普适性方案。该研究不仅为服务机器人(如医院导诊、商场导购)的自主跟随提供身份感知新范式,其“分段-对抗”框架更可拓展至心音分类、关节异响检测等医疗声学场景,推动非接触式生物识别技术向实用化迈进。
生物通微信公众号
知名企业招聘