
-
生物通官微
陪你抓住生命科技
跳动的脉搏
XAI-DeepNET:一种基于可解释人工智能的动态手势识别深度学习新框架
【字体: 大 中 小 】 时间:2025年08月12日 来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
本文提出了一种创新性的XAI-DeepNET框架,将深度学习(DL)与可解释人工智能(XAI)相结合,用于动态手势识别(DGR)。该框架通过关键帧提取、改进小波阈值去噪(MWTh)和手部分割等预处理步骤,结合DeepNET进行手势识别,并利用XAI(如Grad-CAM)提供决策解释。在印度手势数据集和20BN Jester数据集上分别达到99.94%和96.21%的识别准确率,显著优于现有模型,为医疗辅助、人机交互(HCI)等领域提供了高精度且透明的解决方案。
Highlight
本研究设计了一种支持XAI的深度学习框架XAI-DeepNET,用于动态手势识别(DGR)。该框架通过预处理(如关键帧提取、改进小波阈值去噪MWTh和手部分割)、DeepNET模型训练及XAI解释(如Grad-CAM可视化)三阶段实现高精度且透明的动态手势分类。
Description of the proposed model
XAI-DeepNET首先对输入视频进行预处理,包括关键帧提取、MWTh去噪和基于肤色模型的手部分割。随后,设计的DeepNET模型通过卷积层和时空特征学习实现手势分类,并利用Grad-CAM生成热力图解释模型决策依据,增强可解释性。
Simulation results and discussions
实验在印度手势数据集(99.94%准确率)和20BN Jester数据集(96.21%准确率)上验证了XAI-DeepNET的优越性。对比实验表明,其性能超越传统机器学习(如SVM、DT)和其他深度学习模型(如LSTM+Inception v3),且XAI模块有效提升了模型透明度。
Conclusion and future recommendations
XAI-DeepNET为动态手势识别提供了高精度和可解释性兼备的解决方案,未来可拓展至医疗辅助(如听障人士交流)和智能监控领域。建议进一步优化实时性并探索多模态数据融合。
生物通微信公众号
知名企业招聘