编辑推荐:
为解决手部接触数据低分辨率和采集不全问题,研究人员构建 Ti3D-contact 数据集,精度高且可靠,意义重大。
在科技飞速发展的今天,人类对手部的研究不断深入。我们的双手,布满了超过 17000 个机械感受器,就像一个个精密的探测器,在与物体接触时,能感知到各种各样的信息。无论是拿起一杯水,还是握住一支笔,手部都需要根据物体的特征调整姿势和动作,从而形成特定的接触区域。了解手部动作与接触区域之间的关系,对于分析手部操作模式、指导手部相关传感器和机器人的设计,以及预测物体属性等方面,都有着极其重要的意义。
然而,目前手部接触数据的研究面临着诸多挑战。以往研究采用的测量设备,如电容式和电阻式触觉手套、固定阵列力传感器、热成像相机等,都存在一定的局限性。电容式和电阻式触觉手套虽然能捕捉手部接触区域,但由于人类手部操作复杂,其表面难以完全布满传感器,导致接触区域采集不完整。像基于电容式手套获得的视觉 - 触觉双峰数据集,分辨率仅为 12mm,且触觉传感单元仅覆盖指尖和部分手掌区域 。固定阵列力传感器虽能采集到完整的接触区域,但受传感器固有尺寸和排列间隙的影响,分辨率较低,从 2.5mm 到 40mm 不等。热成像相机则容易受到环境温度和热耗散的影响,使得手部接触数据的完整性和准确性大打折扣。这些问题严重阻碍了手部操作模式的研究发展。
为了突破这些困境,中国科学技术大学人形机器人研究所的研究人员开展了一项极具意义的研究。他们构建了一个名为 Ti3D-contact 的高分辨率全身手部接触数据集,该研究成果发表在《Scientific Data》上。
研究人员采用了一系列关键技术方法。在数据采集方面,招募了 12 名年龄在 20 - 30 岁之间、认知能力完好且手部功能熟练的志愿者(8 男 4 女,11 人右利手,1 人左利手)。让志愿者戴上棉纺织手套,对 10 种不同形状的 3D 打印物体进行抓握和操作,物体表面喷涂高附着力的黑色哑光漆,这样就能在手套上完整地记录手部与物体的接触区域。之后,使用 EinScan 手持式 3D 扫描仪对戴有涂漆手套的 3D 打印手部模型进行扫描,获取原始手部接触数据,以 3D 模型和纹理图像的形式保存。在数据处理阶段,通过纹理映射、主成分分析(PCA)等方法,对原始数据进行处理,建立新的坐标系,统一数据的坐标表示。
研究结果如下:
- 数据集构成:Ti3D-contact 数据集包含 1872 组纹理图像和 3D 模型,由 12 名健康成年人对 10 个标准化物体进行 52 种规定的抓握和操作动作产生。这 52 种动作涵盖了 Feix 团队总结的 33 种常用传统抓握手势、Elliott 团队提出的 9 种基本操作手势,以及基于 Bullock 团队分类方法引入的 10 种新的常见操作手势,基本覆盖了生活中的各种应用场景。
- 分辨率:经计算,该数据集的平均分辨率为 0.72mm。研究人员通过遍历点云形式的处理后手部接触数据,计算相邻点之间的欧几里得距离来确定分辨率,公式为R=N1∑i=1Nminj=idist(pi,pj) ,其中pi和pj是处理后手部接触数据中的不同采样点,dist是计算欧几里得距离的函数dist(pi,pj)=(xi?xj)2+(yi?yj)2+(zi?zj)2 。
- 可靠性验证:通过计算体素化手部接触数据在三个重复周期中的重叠率来验证数据的可靠性。结果显示,所有手部接触数据的平均重叠率为 90%,每个参与者的重叠率在 88% - 91% 之间。具体计算时,利用 z - score 统计量排除异常值,再通过体素化方法将处理后的手部接触数据量化为体素序列V(p) ,体素重叠率O的计算公式为O=31(∣V1∪V2∣∣V1∩V2∣+∣V1∪V3∣∣V1∩V3∣+∣V2∪V3∣∣V2∩V3∣) ,其中V1 ,V2和V3代表三个重复周期的体素序列。
- 动作分类:研究人员利用卷积神经网络(CNN)对 52 种抓握和操作手势进行分类。将处理后的手部接触数据(包括 3D 模型和纹理图像)投影到 XY、YZ 和 XZ 三个平面,得到 5616 组 2D 手部接触数据作为分类任务的数据库。CNN 模型经过 40 个 epoch 的训练,每个 batch 包含 50 个样本,最终分类准确率达到 95%。此外,研究人员还使用了随机森林、逻辑回归和卷积自动编码器等模型进行分类,这些模型的准确率也接近 95%。
研究结论表明,Ti3D-contact 数据集具有高分辨率和全身采集的特性,为手部姿势识别、手部动作预测等研究提供了有力的数据支持。在实际应用中,该数据集可用于数据分析和行为习惯研究,基于机器学习模型预测抓取物体的类型和属性,以及在虚拟现实中对手部动作模式进行分类。在手部相关传感器和机器人设计领域,通过分析手部操作模式,探索抓握稳定性与接触区域之间的关系,从而指导灵巧手和康复手套的结构和传感器系统设计,推动人机交互的发展,提高操作的安全性和稳定性,降低成本。
不过,该研究也存在一定的局限性,如实验仅使用了 10 种物体类型,而日常生活中手部操作涉及的物体种类繁多且形状各异。未来,研究人员将继续扩大抓取物体的类型,增强数据集的多样性和鲁棒性,以更好地支持更广泛的应用和研究场景。总的来说,这项研究为手部接触数据的研究开辟了新的道路,具有重要的理论和实践意义,有望推动相关领域的进一步发展。