构建与验证危重症儿童疼痛面部表情数据集:为人工智能疼痛评估提供新范式

【字体: 时间:2025年05月18日 来源:Scientific Reports 3.8

编辑推荐:

  针对非沟通能力儿童疼痛评估数据集匮乏问题,复旦大学附属儿科医院团队构建危重症儿童疼痛面部表情数据集(PFECIC),含 53 例患儿的 119 段视频及 6951 张图像,经深度学习验证准确率达 88.3%。其在准确性与全面性上优于 COPE 数据集,为 AI 辅助疼痛评估奠定基础。

  
疼痛,作为一种与实际或潜在组织损伤相关的不愉快感觉和情感体验,正成为全球公共健康领域的重要挑战。据统计,全球约 20% 的患者饱受疼痛困扰,而危重症儿童因疾病状态和频繁医疗操作,更是疼痛的高危群体。在中国,一项覆盖 66 家医疗机构的调查显示,住院儿童疼痛管理现状不容乐观,尤其是危重症患儿的疼痛发生率较高。然而,对于无法或拒绝 verbal communication 的患儿,依赖面部表情和行为线索的观察性评估成为关键。但现有评估工具存在评估者间差异大、耗时等问题,且缺乏适用于全年龄段儿童的通用工具。

随着人工智能(AI)和计算机视觉技术的发展,基于面部图像分析的疼痛评估算法展现出潜力,但高质量数据集的匮乏严重制约了其发展。现有成人疼痛数据集(如 UNBC-McMaster Shoulder Pain Archive、BioVid Heat Pain Database)和新生儿疼痛数据集(如 FENP、COPE),或因年龄覆盖范围窄,或因样本量小、疼痛场景单一,难以满足危重症儿童复杂的临床需求。在此背景下,复旦大学附属儿科医院的研究团队开展了一项具有突破性的研究,相关成果发表在《Scientific Reports》。

为填补这一空白,复旦大学附属儿科医院联合复旦大学计算机科学技术学院等机构,构建了首个针对中国危重症儿童的疼痛面部表情数据集(Pain Facial Expression of Critically Ill Children, PFECIC)。研究团队从医院 PICU 和 CICU 招募 53 例患儿(年龄 28 天至 18 岁),采集了 7 种常见疼痛性医疗操作(如雾化吸痰、气管插管吸痰等)中的 119 段视频和 6951 张面部图像,并依据 COMFORT 行为量表的 “面部肌肉” 类别,将疼痛程度分为 5 级(1 分:面部肌肉完全放松;5 分:面部肌肉扭曲 grimacing)。所有数据经 3 名资深护士独立三重复核标注,确保标注一致性。

研究采用的关键技术方法包括:

  1. 数据采集:使用海康威视监控摄像头(1920×1080 分辨率),以垂直俯视角度(30 度视角限制)记录患儿操作前后各 2 分钟的面部视频,确保面部占据画面至少 50%。
  2. 标注流程:通过自定义软件工具对视频进行分段标注,采用最大变异抽样法选取样本,确保年龄、性别、通气状态等因素的多样性。
  3. 图像筛选:利用帧差法(frame difference method)自动过滤表情无显著变化的帧,保留有效图像。
  4. 模型验证:基于 Swin Transformer 架构,对比 PFECIC 与 COPE 数据集在疼痛分类中的表现,评估指标包括准确率、精确率、召回率、F1 值和假阳性率(FPR)。

研究结果


1. PFECIC 数据集特征


数据集涵盖 PICU(47.9%)和 CICU(52.1%)场景,男性患儿占比 72.3%,年龄分布广泛(≤1 岁占 16.0%,≥12 岁占 19.3%),包含机械通气(47.1%)与非通气患儿。疼痛图像按等级分布为:1 分 375 张、2 分 1887 张、3 分 1624 张、4 分 1499 张、5 分 1566 张,呈现较均衡的多等级分布。

2. 模型性能验证


在 PFECIC 数据集上,Swin Transformer 模型实现了 88.3% 的总体准确率,各等级准确率为 80.7%(4 分)至 95.2%(2 分),F1 值达 88.5%,FPR 为 3.0%。ROC 曲线显示,除 3 分(AUC=0.764)和 4 分(AUC=0.824)外,其余等级 AUC 均超过 0.93,表明模型对多数疼痛等级具有高区分度。

3. 与 COPE 数据集对比


COPE 数据集(26 例健康新生儿,204 张图像,仅分 “疼痛” 与 “非疼痛” 两类)因样本量小、类别不平衡,模型准确率仅 70.8%,疼痛类召回率仅 33.3%。而 PFECIC 在统一二分类标准(1 分为非疼痛,2-5 分为疼痛)下,准确率(95.9% vs 70.8%)、精确率(91.2% vs 72.5%)等指标均显著优于 COPE,且误预测主要集中在相邻等级,验证了标注体系的合理性。

4. 跨数据集泛化能力


使用 PFECIC 训练的模型在 COPE 数据集上测试,疼痛识别准确率(55.4%)虽低于原数据集,但显著高于 COPE 自身训练结果(33.3%),表明大数据量训练可提升模型泛化能力。

研究结论与意义


本研究构建的 PFECIC 数据集是首个针对危重症儿童的大规模多等级疼痛面部表情数据集,填补了现有儿童疼痛评估领域的空白。其优势体现在:

  • 临床相关性:覆盖真实临床场景中的多种疼痛操作,包含带医疗管路患儿的数据,更贴近 ICU 实际需求。
  • 方法学创新:标准化的数据采集流程与三重标注机制,确保了数据的可靠性和可重复性。
  • 技术突破:通过深度学习验证,证实 PFECIC 可有效提升疼痛评估算法的准确性和泛化能力,为 AI 辅助临床疼痛管理提供了高质量数据基础。

尽管研究存在面部遮挡影响分析、单一模态局限性等不足,但为后续开发融合面部表情、体动和生理指标的多模态疼痛评估模型奠定了基础。PFECIC 的建立,不仅为儿童疼痛领域的人工智能研究提供了关键资源,更有望通过精准疼痛评估改善危重症患儿的镇痛管理,减少短期并发症(如谵妄、睡眠障碍)和长期健康影响,具有重要的临床转化价值和公共卫生意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号