《Scientific Data》:Human Activity Recognition Dataset for Pedestrians with Mobility Disabilities
编辑推荐:
本研究针对行动障碍人群缺乏专用活动识别数据集的现状,收集了包含静止、行走、使用拐杖、助行器、手动轮椅和电动轮椅六类基本活动的传感器数据。该数据集(HAR-PMD)来自120名参与者佩戴的智能手机和智能手表,提供了14,400分钟的智能手机数据和7,200分钟的智能手表数据。基准分析显示,最佳组合下的分类准确率在随机评估中达到99.64%,在用户独立评估中达到98.79%。这项工作填补了行动障碍人群活动识别公共数据集的空白,为开发个性化辅助技术奠定了基础。
在智能化浪潮席卷全球的今天,人类活动识别(Human Activity Recognition, HAR)技术早已悄然融入日常生活。从智能手环记录步数,到手机自动识别运动状态,这些技术为健康人群带来了诸多便利。然而,当我们把目光投向行动障碍人群时,却发现技术普惠的阳光尚未完全照耀这个特殊群体。究其原因,并非算法不够先进,而是缺乏专门针对行动障碍人群活动特征的标准化数据集。
目前,学术界已有大量基于智能手机和智能手表传感器的HAR研究,但这些研究大多聚焦于健康人群的基本活动,如行走、跑步、上下楼梯等。对于使用拐杖、助行器或轮椅的人群而言,他们的活动模式与健康人群存在显著差异,而现有的识别模型难以准确捕捉这些特殊模式。这种数据缺失导致针对行动障碍人群的上下文感知计算应用发展缓慢,无法为他们提供真正有效的个性化辅助服务。
为了解决这一迫切需求,来自韩国汉阳大学的研究团队在《Scientific Data》期刊上发表了题为"Human Activity Recognition Dataset for Pedestrians with Mobility Disabilities"的研究论文。该研究首次系统性地收集并公开了针对行动障碍人群的移动活动识别数据集HAR-PMD,为相关领域的研究提供了宝贵资源。
研究人员开展了一项规模可观的数据采集工作,招募了120名参与者(平均年龄23.8岁,标准差2.7岁,女性44名),使用智能手机和智能手表收集了六类基本活动数据:静止、行走、使用拐杖、使用助行器、使用手动轮椅和使用电动轮椅。每项活动均在室内和室外两种环境下进行11分钟的数据采集,确保了数据的多样性和代表性。
在技术方法层面,研究团队主要采用了以下关键技术:基于Android Sensors API的传感器数据采集技术,以60Hz频率采集了智能手机的13种传感器数据和智能手表的5种传感器数据;数据预处理采用了线性插值和5秒固定窗口分割技术;特征提取包含时域和频域共11类特征;分类模型方面,同时采用了传统机器学习(决策树、随机森林、XGBoost、支持向量机)和深度学习(多层感知器、卷积神经网络、长短期记忆网络、Transformer)方法;评估方案则设计了用户依赖和用户独立两种交叉验证策略。
技术验证与结果分析
研究团队提出了三种不同细粒度的识别任务:任务(a)区分是否有行动障碍;任务(b)区分使用步行辅助工具还是轮椅;任务(c)详细识别具体的移动辅助设备类型。这种分层设计使得数据集可以满足不同应用场景的需求。
传感器组合的影响
研究比较了三种传感器组合的性能:仅使用线性加速度计(A)、线性加速度计+陀螺仪(AG)、线性加速度计+陀螺仪+磁力计(AGM)。结果表明,AG和AGM组合的性能明显优于单一传感器,而AG和AGM之间性能差异不大。这说明陀螺仪提供的角速度信息对活动识别有重要贡献,而磁力计的附加价值相对有限。
分类模型性能比较
在传统机器学习方法中,集成学习模型(随机森林和XGBoost)表现最佳;在深度学习方法中,卷积神经网络(CNN)和长短期记忆网络(LSTM)表现最为稳定。特别是在最复杂的任务(c)中,LSTM在用户依赖评估下达到了97.98%的准确率,显示出深度学习模型在复杂时间序列模式识别中的优势。
用户独立评估的挑战
研究结果验证了一个重要现象:用户独立(User-Independent, UI)评估的准确率明显低于用户依赖(User-Dependent, UD)评估。以任务(c)为例,UD评估最高准确率为97.98%,而UI评估最高仅为89.40%。这种性能下降反映了模型在新用户上的泛化能力仍有提升空间,是实际应用中需要解决的关键问题。
多设备融合的优势
一个值得关注的发现是,结合智能手机和智能手表数据可以显著提升识别性能。特别是在区分容易混淆的活动(如拐杖与助行器、手动轮椅与电动轮椅)时,多设备融合提供了互补的信息视角。
从图5的混淆矩阵可以直观看出,仅使用智能手机数据时,步行辅助工具(拐杖和助行器)与轮椅(手动和电动)之间存在明显的混淆现象。而结合智能手表数据后,这些混淆显著减少,证明手腕部位的传感器数据提供了独特的运动特征信息。
图6的t-SNE可视化进一步证实了这一点:仅使用智能手机数据时,不同活动类别的数据点在特征空间中有较大重叠;而结合智能手表数据后,各类别之间的区分更加清晰。
研究结论与意义
本研究成功构建了首个专门针对行动障碍人群的公开活动识别数据集HAR-PMD,并提供了全面的基准分析。研究表明,基于商用智能设备的传感器数据可以有效识别行动障碍人群的基本活动模式,为相关应用开发奠定了坚实基础。
这项工作的重要意义体现在多个层面:在技术层面,它填补了行动障碍人群活动识别数据集的空白,为算法研究和模型优化提供了标准基准;在应用层面,它为开发个性化的辅助技术创造了条件,如基于活动类型的自适应导航系统、长期健康监测平台等;在社会层面,它推动了技术普惠和包容性发展,让行动障碍人群也能享受智能化带来的便利。
研究人员也坦诚指出了研究的局限性:参与者主要为年轻学生,且活动是在受控环境下模拟进行的。未来研究需要扩展到真实世界的长期数据收集,并涵盖更广泛年龄段的真实用户群体。
总体而言,HAR-PMD数据集的发布标志着行动障碍人群活动识别研究迈出了重要一步。随着数据的不断丰富和算法的持续优化,我们有理由期待,未来会有更多智能技术能够真正理解并满足行动障碍人群的特殊需求,让科技的光芒照亮每一个角落。