编辑推荐:
现有疼痛评估方法存在诸多局限,如依赖患者自报或生理信号监测,无法满足远程医疗需求。研究人员开展基于面部特征和视频流多模态融合的实时疼痛评估研究,所提框架 AUC 达 0.99,准确率提升 12.5% ,为远程疼痛评估提供新方案。
在医疗领域,疼痛评估一直是个重要且棘手的问题。传统的疼痛检测方法,主要依靠患者自我报告和生理信号监测。然而,当患者无法言语交流,像昏迷、年幼或患有语言障碍的患者,自我报告就无法实现;而在需要持续监测的场景下,生理信号监测也存在局限性,它可能无法及时、准确地反映患者的疼痛程度。
随着远程医疗的兴起,对客观、自动化疼痛评估机制的需求愈发迫切。但现有的疼痛评估方法面临重重挑战。例如,不同人群的数据存在差异,使得模型在不同个体上的表现不稳定;对细微疼痛线索的敏感度低,容易漏诊;计算效率低,无法满足实时处理的要求。一些先进的方法,如基于 Transformer 的架构和掩码自动编码器,虽然精度较高,但计算成本高、通用性有限。CNN-LSTM 混合方法也难以实现实时功能,可穿戴技术和基于传感器的融合则容易受到噪声和模态依赖的影响。
为了解决这些问题,来自国外的研究人员开展了一项关于实时疼痛评估的研究。他们提出了一种增强的深度学习多模态框架,该研究成果发表在《Engineering Applications of Artificial Intelligence》上。这一研究成果意义重大,为非言语疼痛检测提供了一种符合伦理、可扩展的解决方案,推动了自动化疼痛评估领域的发展。
研究人员在开展研究时,用到了几个主要关键的技术方法。首先,使用了预训练的卷积神经网络 VGG16(Visual Geometry Group 16-layer network)来提取面部表情中的空间特征,其强大的空间特征捕捉能力为后续分析奠定了基础。其次,采用了双向长短期记忆网络(Bi-LSTM,Bidirectional Long Short-Term Memory network)并融入注意力机制,以此来捕获时间特征,提升对疼痛线索随时间变化的检测能力。此外,运用自适应增强算法提升模型在不同场景下的泛化能力,利用梯度加权类激活映射(Grad-CAM,Gradient-weighted Class Activation Mapping)对模型决策过程进行可视化解释 。研究使用了 BioVid、UNBC-McMaster 和 MIntPAIN 等多个基准数据集进行实验。
下面来看具体的研究结果:
- 数据准备:研究使用了三个基准数据集。BioVid 热痛数据库(Part A)包含 17,300 个视频片段,涉及 87 名受试者(43 名女性,年龄 20 - 65 岁;44 名男性,年龄 20 - 64 岁),由高质量 1080p 相机和同步生理传感器在实验室环境下记录,每个疼痛类别约有 20,000 帧,为模型训练和测试提供了充足的数据。
- 模型架构:提出的实时疼痛评估模型采用双分支架构,通过分析视频帧,基于患者面部表情和地标实时测量疼痛水平。流程包括视频输入捕获、面部地标提取、基于 VGG16 的空间特征提取,以及利用 Bi-LSTM 网络处理时间依赖关系,最后融合特征进行评估。
- 评估与测试:研究采用 5 折分层交叉验证、性能指标分析、与基线模型对比、非参数统计方法和实时测试等策略对模型进行评估。结果显示,该模型在各项评估指标上均优于当代最先进的模型。与传统的 CNN - LSTM 模型相比,该框架的准确率提高了 12.5%,假阳性率降低了 20%,在 NVIDIA Jetson Nano 上实时部署时,每帧推理时间为 120 毫秒,精度损失小于 1%。
- 讨论:模型中复杂的多注意力机制与后期融合策略的结合,能够有效捕捉与疼痛相关的面部表情内在细节,在准确率、召回率和 F1 分数上都有显著提升,这对于临床应用至关重要,可靠的疼痛检测有助于及时进行医疗干预。
在研究结论和讨论部分,研究人员提出的多分支深度学习方法在多个基准测试中表现出色,超越了当前最先进的方法,在临床和资源有限的环境中都展现出良好的适用性和鲁棒性。通过将基于注意力的面部地标分析融入后期融合框架,模型能够成功识别复杂的面部模式,实现高精度的疼痛评估。该研究为自动化疼痛评估领域提供了新的思路和方法,有望推动远程医疗和疼痛管理技术的进一步发展,帮助医疗人员更准确、及时地评估患者疼痛状况,为患者提供更优质的医疗服务。