基于多源开放数据集整合分析的急性应激预测模型构建与泛化性研究

【字体: 时间:2025年06月18日 来源:Journal of Medical and Biological Engineering 1.6

编辑推荐:

  这篇综述系统评估了利用开放数据集(WESAD、Physionet等)训练机器学习(ML)和深度学习(DL)模型预测急性应激的潜力,创新性地提出跨数据集整合策略与数据协调技术(如pyCombat),通过HRV(心率变异性)、EDA(皮肤电活动)等多模态生理信号特征提取,构建了准确率达80%-95%的分类模型(RF/AdaBoost),并首次验证了模型在VR(虚拟现实)职业应激管理中的泛化应用价值。

  

引言

应激是机体对外部或内部压力源的生理心理反应,持续应激会降低生活质量。现有研究多基于单一数据集(如WESAD或驾驶员数据集),但传感器差异和实验协议异质性限制了模型泛化性。本研究首次整合非EEG数据集、驾驶员数据集和护士数据集,通过协调技术解决跨数据集偏差,构建可应用于真实场景的急性应激预测模型。

材料与方法

数据集特征
选取3个开放数据集:

  1. 非EEG数据集:包含20名健康受试者的EDA、温度、SpO2
    等信号,标记4类应激类型(情绪/认知/身体应激、放松)
  2. 驾驶员数据集:17名驾驶员ECG、EMG、呼吸信号,按应激程度分为3类(休息/应激/高应激)
  3. 护士数据集:15名护士Empatica E4采集的EDA、HR等,基于自评分为2类(无应激/应激)

关键技术

  • 超短时HRV分析(60秒窗口):提取AVNN、SDNN等时域特征,LF/HF频域特征
  • 协调策略:采用pyCombat消除数据集间批次效应
  • 特征选择:ANOVA-F与递归特征消除(RFE)筛选关键特征如mean_nni、cvi

结果

模型性能

  1. 非EEG数据集:深度模型(DL)准确率80%,优于随机森林(RF)的70%,情绪应激最易识别(F1=0.82)
  2. 驾驶员数据集:RF模型达87%准确率,高应激特异性达89%
  3. 跨数据集整合:协调后的"超短时数据集"(驾驶员+非EEG)使AdaBoost准确率提升至95%,应激检测灵敏度91%

泛化性验证

  • 留一受试者交叉验证(LOSO)显示模型对未见受试者保持70%准确率
  • 外部验证(TSST实验数据)证实HRV特征(如RMSSD)的跨场景稳定性

讨论

研究突破在于:

  1. 多模态整合:首次联合HRV与EDA特征,解决GSR(皮肤电反应)单一信号的环境敏感性缺陷
  2. 协调技术价值:数据集间统计差异降低后,模型在VR应用场景展现潜力
  3. 局限性:自评标签可能引入偏差,未来需结合无监督聚类验证应激标记

结论

构建的ML/DL模型在急性应激识别中表现优异(最高95%准确率),协调策略使模型泛化性提升至70%。该框架为可穿戴设备实时监测系统提供基础,尤其适用于职业健康中的VR应激干预场景。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号