编辑推荐:
为解决 Prechtl 一般运动评估(GMA)在应用中的局限,研究人员开展婴儿运动分类的传感器融合研究。结果显示三传感器融合分类准确率达 94.5% ,高于单模态评估。该研究为自动分类婴儿运动模式提供新途径,有助于早期检测神经发育状况。
在婴儿神经发育评估领域,Prechtl 一般运动评估(GMA)是一项具有重要临床价值的工具。它能通过评估婴儿内源性产生的运动功能,在婴儿出生后的前几个月检测出神经系统损伤,进而为诸如脑瘫、自闭症谱系障碍(ASD)、雷特综合征(RTT)等多种神经发育疾病的早期诊断和干预提供关键依据。然而,传统的 GMA 依赖于经过严格训练且获得认证的评估人员,这一过程不仅成本高昂,而且在偏远地区或缺乏专业人员的地方难以开展。此外,人工评估容易受到人为因素和环境因素的干扰,导致评估结果的准确性和稳定性受到影响。同时,现有的基于机器学习的自动化 GMA 方法大多基于单一传感器模态,其分类性能与训练有素的人类评估人员相比仍有较大差距,且不同模型之间缺乏可比性。在这样的背景下,开展新的研究以改进 GMA 的评估方法迫在眉睫。
来自德国哥廷根大学医学中心、海德堡大学等多个研究机构的研究人员,针对上述问题展开了深入研究。他们提出了一种传感器融合方法,旨在提高婴儿运动分类的准确性,进而推动基于人工智能(AI)的神经功能早期识别技术的发展。研究结果表明,三传感器融合模型的分类准确率达到了 94.5% ,显著高于任何单一传感器模态的评估结果。这一成果为自动化分类婴儿运动模式开辟了新的途径,有望实现对神经发育状况的自动化早期检测,在临床应用中具有重要意义。该研究成果发表在《Communications Medicine》上。
研究人员在这项研究中运用了多种关键技术方法。首先,他们收集了 51 名婴儿从 4 到 16 周龄的多模态运动数据,包括 2D RGB 相机、压力感应垫和六个惯性测量单元(IMU)采集的数据。在数据处理方面,采用了先进的姿态估计框架 ViTPose 提取视频数据中的人体关键点;对压力垫数据,计算压力中心(CoP)坐标等特征;IMU 数据则获取加速度和角速度值。分类模型上,使用卷积神经网络(CNN)进行运动分类,并通过 9 折交叉验证评估模型性能。同时,对比了早期融合和晚期融合两种传感器融合策略。
下面来看具体的研究结果。
- 单传感器模态的分类性能:研究对比了仅使用一种传感器模态时的分类性能。结果显示,使用压力垫特征(MAT)的分类准确率为 82.1% ,低于惯性测量单元(IMU,90.2%)和基于视频的骨骼特征(VID,90.7%)。其中,MAT 与 VID 的差异具有统计学意义(p<0.01),MAT 与 IMU 的差异接近显著(p = 0.055),而 IMU 和 VID 的性能差异不显著。此外,压力垫传感器的分类准确率在不同测试集中波动较大,而 IMU 和视频传感器的准确率则较为稳定。
- 传感器融合的分类性能:在两传感器融合方面,其分类准确率通常高于单模态,但差异大多不具有统计学意义。例如,VID 与 IMU 融合的性能显著优于 MAT 或 IMU 单独使用,但与 VID 单独使用相比差异不显著;MAT 与 IMU 或 VID 融合,性能显著优于 MAT 单独使用,但不如 IMU 或 VID 单独使用。三传感器融合的性能优于任何单一传感器,也显著优于包含 MAT 的两传感器融合模型,但与 VID + IMU 的两传感器融合相比,差异不显著。同时,研究还比较了早期融合和晚期融合两种方式,发现晚期融合(94.5%)的平均分类准确率略高于早期融合(93.2%),但差异无统计学意义(p = 0.164)。
研究结论和讨论部分强调了多个重要观点。首先,不同传感器模态的性能存在差异,单模态分类准确率存在一定局限性,而传感器融合能够提升分类精度,特别是三传感器融合在婴儿运动分类任务中表现出色。其次,非侵入性传感器融合(如 MAT + VID)在保证准确率的同时,具有操作简便、对婴儿干扰小的优势,适合获取和共享大规模临床数据,为未来 AI 驱动的诊断工具发展提供了有力支持。此外,尽管当前传感器融合方法在设置和数据分析上较为复杂,但如果能显著提高 GMA 自动化解决方案的性能,其付出的努力将是值得的。这项研究为实现基于 AI 的婴儿运动深度表型分析和分类提供了重要的方法学突破,有望推动相关领域的进一步发展,助力更准确地预测与多种神经发育结局相关的发展轨迹。