一种基于语音的低功耗抑郁症识别处理器,采用分层式局部-全局网络架构
《IEEE Transactions on Very Large Scale Integration (VLSI) Systems》:A Low-Power Speech-Based Depression Recognition Processor With Hierarchical Local–Global Network
【字体:
大
中
小
】
时间:2025年11月27日
来源:IEEE Transactions on Very Large Scale Integration (VLSI) Systems 3.1
编辑推荐:
抑郁症语音识别研究提出分层局部-全局网络和优化处理器设计,结合CNN与多头注意力机制提升识别精度,采用跨层缓冲数据流减少98.77%存储,通过层融合、算子优化和量化降低功耗,FPGA实现MAE 5.13,180nm ASIC功耗17.4μW。
摘要:
抑郁症是一个严重的公共卫生问题,其诊断率较低,这通常是由于社会污名化、缺乏认识以及人们不愿寻求帮助所致。通过可穿戴设备实现持续且不显眼的抑郁症指标监测,可以缓解干预延迟的情况。与基于脑电图(EEG)和视频的抑郁症识别方法相比,基于语音的识别方法可以在用户无需主动注意的情况下进行。然而,由于现有算法的准确性有限以及边缘计算资源的限制,在可穿戴平台上实现精确的基于语音的抑郁症识别仍然面临挑战。因此,为了实现不显眼、准确且高效的边缘抑郁症识别,本文提出了一种分层局部-全局网络(HLG-Net)和优化的处理器设计。所提出的HLG-Net结合了卷积神经网络(CNN)和多头注意力(MHA)机制,能够同时捕捉局部声学特征和全局话语层面的连贯性,从而提高抑郁症阶段的识别能力。为了实现高效的处理器设计,采用了一种跨层缓冲数据流技术来高效处理数据,将数据存储量减少了98.77%。计算单元(CU)通过层融合、运算符优化和量化技术进一步提高了资源利用率,并在保持识别准确性的同时降低了功耗。系统级别的低功耗技术,如时钟/输入门控和针对特定应用集成电路(ASIC)的接近阈值设计,进一步减少了功耗。该处理器在现场可编程门阵列(FPGA,型号XC7Z100-2FFG900)上实现,其在AVEC 2014数据库上的平均绝对误差(MAE)最低,为5.13。180纳米工艺的ASIC在0.4伏电压下的模拟功耗为17.4微瓦。这些结果证明了基于语音的抑郁症识别方法的准确性和高效性的可行性...
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号