《Medical Engineering & Physics》:Leveraging LDA feature extraction to augment human activity recognition accuracy
编辑推荐:
人类活动识别研究提出结合LDA降维与MLP特征提取的轻量级模型,通过SVM-SGD优化分类,在UCI-HAR数据集上达到99.52%准确率,与现有最优方法差距不显著。
Milad Vazan|Elaheh Sharifi|Hadi Farahani|Sadegh Madadi
伊朗德黑兰沙希德·贝赫什蒂大学数学科学学院计算机与数据科学系
摘要
人类活动识别(HAR)是一个多学科研究领域,它整合了多种传感器数据来识别和分类人类进行的所有身体活动。这些传感器可以是环境的一部分、可穿戴技术或智能手机。当前的研究致力于通过提出一种结合LDA和MLP方法的混合特征提取策略,来解决特征向量降维和基于智能手机的人类活动准确分类的问题。此外,还使用了带有SGD的SVM优化来提高活动分类的准确性。在本文中,LDA被用来提取一个新的特征空间,以更好地增强类别分离并测试特征标签预测。所提出的方法称为LMSS,并在UCI-HAR数据集上进行了测试,达到了先进的准确率水平。LMSS框架在UCI-HAR数据集上的准确率达到99.52%。统计分析表明,与最强基线方法(mGRRF+XGB,99.36%)相比,差异不具有统计学意义(p = 0.12,α = 0.05),这表明两者效果相当,而非存在明显的性能差距。
引言
人类活动识别(HAR)是一个研究领域,它专注于利用感官观测数据自动确定和命名活动,试图通过可获取的信息来识别和理解某人当前正在做什么[1]、[2]。它在多个领域发挥着关键作用,包括医疗保健[3]、[4]、[5]、体育[6]、[7]、锻炼[8]、[9]、[10]、[11]、[12]、[13]、[14]、安全[15]以及人机交互[16]。HAR方法可以分为两大类[10]、[17]、[18]、[19]、[20]、[21]:基于传感器的和基于视觉的。基于视觉的方法使用位于人类环境中的摄像头从图像和视频流中提取人类活动特征[22]。而在基于传感器的方法中,数据是通过加速度计、陀螺仪和磁力计等传感器收集的[20]。与基于视觉的方法所需的设备不同,这些传感器轻便且便携[23]。
HAR研究领域旨在不断提高识别性能至最高水平[19],同时解决在最小计算资源下实现高准确性的挑战[24]。需要更多层和神经元的大型模型虽然显著提高了准确率,但也带来了计算和内存需求的挑战,特别是对于具有严格限制的移动和嵌入式系统而言,这需要开发新的解决方案来减小网络规模并确保快速推理而不牺牲准确率[25]。
本文介绍了一种自动活动识别系统,该系统通过减少特征和参数的数量来高效地对人类活动进行分类。为了实现这一目标,我们采用了LDA降维技术以及一个参数数量远少于其他现有模型的简单神经网络架构。
本文的主要贡献可以总结如下:
1.在我们的案例中,混合特征提取方法结合了LDA和MLP进行特征提取,而通过随机梯度下降(SGD)进行SVM优化以实现分类。主要面临两个挑战:首先是特征向量的降维,其次是使用智能手机准确分类人类活动。这种技术的结合旨在提高分类器的泛化性能,同时最小化过拟合问题。
2.我们对几种机器学习(ML)算法进行了比较分析:逻辑回归(LR)、高斯朴素贝叶斯(GNB)、决策树(DS)、支持向量机(SVM)、k最近邻(k-NN)、使用随机梯度下降的SVM变体(SVM-SGD)分类器以及随机森林(RF)。所有这些比较都是基于原始特征数据集、LDA提取的特征数据集以及LDA和MLP共同提取的特征数据集进行的。这意味着我们的工作开发了一个参数有限的神经网络模型,在人类活动识别准确率方面超越了基于深度学习的方法。
3.为了验证我们的模型,我们选取了几个作为UCI-HAR数据集上最先进研究的一部分而提出的模型进行比较。实验结果表明,我们提出的方法在该数据集上的表现优于最佳方法。
最近使用智能手机惯性传感器的HAR技术进步主要集中在增强在不受限制或实际环境中的识别能力上。这些系统旨在提供实用的实时解决方案,强调无需受控环境或外部基础设施即可运行的轻量级流程。作者强调了在智能手机上进行实时识别的轻量级、高效流程的挑战,这与我们专注于移动应用的紧凑型模型的目标是一致的[26]。在关于日常生活中人类身体活动和姿势分类的研究中,扩展了基于智能手机的HAR的应用范围,使其能够在现实世界条件下识别活动和姿势。这项研究通过展示在日常生活环境中的广泛应用来补充我们的工作,但较少关注降维和实时效率,而这些正是我们方法的关键组成部分[27]。
使用智能手机惯性传感器的工作介绍了一个适用于实际场景的上下文感知HAR系统。他们讨论了协议选择和活动识别模型的泛化能力,提供了处理不同上下文的重要见解,与我们的方法类似,但更依赖于深度学习模型[28]。
在不受限制的环境中使用智能手机惯性传感器识别人类活动及其相关上下文的研究提出了一个框架,用于处理活动和上下文的识别。他们的工作强调了上下文感知和在现实世界环境中运行的挑战,与我们的方法一致,但在特征提取时使用了传感器融合和混合模型[29]。我们的方法通过强调使用线性判别分析(LDA)进行降维和MLP特征提取,然后进行SVM分类,从而形成了一个既轻量又能在多个HAR数据集上表现出竞争力的模型。
部分摘录
概述
本研究提出了以下端到端的HAR系统工作流程(图1):数据收集、数据预处理、特征提取、模型训练、其他算法的特征提取、分类和模型评估。我们从广泛认可的UCI-HAR数据集收集数据,这是一个标准的公共资源,许多与活动识别相关的研究都使用该数据集。收集的数据将经过预处理,以确保其质量和适合分析。
结果与讨论
本节详细介绍了实验设置,并基于准确性、精确度、召回率和F分数展示了实验结果。
结论与未来工作
这些结果表明,我们提出的方法在UCI-HAR数据集上实现了所有比较方法中最高的准确率和F1分数。然而,与次优方法(mGRRF + XGB)相比,性能优势相对较小(准确率和F1分数约为0.1-0.2%),可能属于统计变异范围内。在没有进行统计显著性测试的情况下,这些差异应被视为提示性而非决定性的。我们的研究提出了一种混合特征提取方法
利益冲突声明
作者声明他们没有已知的可能会影响本文所述工作的财务利益或个人关系。