
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习与瞳孔响应信号的认知事件自动检测模型研究及其跨领域应用
【字体: 大 中 小 】 时间:2025年08月21日 来源:Scientific Reports 3.9
编辑推荐:
本研究通过机器学习方法,利用任务诱发瞳孔响应(TEPR)信号实现了跨认知领域的认知事件自动检测。研究人员开发了包括通用模型和四种任务特异性模型在内的CNN架构,在警觉性(DPT)、情绪处理、数字推理和工作记忆(VWM)四个认知域中实现了0.43-0.75的MCC值。研究发现通用模型通过牺牲特异性(0.80)提升敏感性(0.75)实现跨领域适应,特征重要性分析揭示瞳孔直径和注视位置对预测的差异化贡献。该研究为实时认知状态监测提供了新方法,在个性化学习、人机交互等领域具有重要应用价值。
在认知神经科学领域,准确识别认知事件的发生时刻对理解人类大脑工作机制至关重要。传统上,研究人员依赖脑电图(EEG)或心电(ECG)等生理信号,但这些方法存在信号噪声大、设备笨重或需要长时间采集等局限。相比之下,瞳孔测量技术因其非侵入性和高时间分辨率展现出独特优势,但如何利用瞳孔信号实现跨认知领域的通用事件检测仍是一个未解难题。
发表在《Scientific Reports》的这项研究创新性地将机器学习应用于瞳孔响应信号分析,开发了能够自动检测多种认知事件的预测模型。研究团队收集了57名参与者在四种认知任务(点探测任务DPT、心算MA、精神运动警觉任务PVT和视觉工作记忆VWM)中的瞳孔直径和注视位置数据,采样率达250Hz。通过构建卷积神经网络(CNN)架构,研究人员建立了1秒时间窗的认知事件检测系统,采用SMOTE技术解决数据不平衡问题,并通过置换特征重要性分析揭示了模型的决策机制。
关键技术方法包括:1)使用250Hz眼动仪采集瞳孔直径和注视位置数据;2)设计包含通用模型和四种任务特异性模型的CNN架构;3)采用五折交叉验证评估模型性能;4)应用置换特征重要性算法解析预测特征贡献;5)开发在线模拟环境评估实时应用潜力。所有数据来自加州大学圣巴巴拉分校的57名志愿者,经相关伦理委员会批准。
【Exploratory data analysis】
初步数据分析揭示了不同认知任务中瞳孔反应的典型模式:除PVT外,所有任务在刺激呈现后约0.6秒出现初始收缩,随后扩张。DPT任务因亮度变化引起显著瞳孔光反射(PLR),而MA、PVT任务在刺激后0-0.5秒出现扫视眼动。VWM任务则因难度差异大而表现出高频信号特征。
【Machine learning architecture comparison】
在四种神经网络架构(CNN、BiLSTM、RNN和MLP)比较中,CNN以最高MCC值(0.55-0.75)胜出。特别值得注意的是,DPT特异性模型达到0.75的MCC值,而通用模型为0.55,显示出专业化与通用化的权衡。
【CNN model performance】
时间窗分析显示1-2秒为最佳预测时长,延长至3秒反而降低性能。通用模型表现出特异性(0.80)与敏感性(0.75)的典型权衡,与特异性模型相比,其预测相关性Pearson系数为0.5-0.7,McNemar检验证实统计显著差异。
【Feature importance】
特征重要性分析揭示关键发现:任务特异性模型主要依赖任务特有结构模式(如DPT中的PLR,MA/PVT中的注视位置变化),而通用模型则更多利用人类认知反应(瞳孔扩张)。移除注视位置特征后,通用模型MCC仅下降0.08,显著小于特异性模型(0.13-0.24)的降幅。
【Online environment simulation】
在线模拟环境中,所有模型MCC值平均下降约0.05。通用模型保持0.49的MCC值,展示出实际应用潜力。有趣的是,在MA任务中观察到与解题过程相关的二次预测峰值,暗示模型可能检测到实验设计外的认知活动。
研究结论部分指出,这项工作首次系统评估了基于瞳孔信号的跨认知领域事件检测可行性。三个关键发现具有重要理论价值:1)通用模型通过调整特异性-敏感性平衡实现跨领域适应;2)模型解释揭示从"任务结构依赖"到"认知反应依赖"的连续体;3)前扣带回皮层(ACC)相关任务(DPT/MA/PVT)与工作记忆(VWM)任务的性能差异可能反映不同神经通路的瞳孔控制机制。
这些发现为实时认知监测技术开发提供了新思路,特别是在个性化教育、人机交互和神经疾病评估等领域。研究同时指出当前局限,如实验室环境约束和缺乏人口统计学信息等。未来工作将整合更多任务类型和个体特征变量,进一步提升模型的泛化能力和实用性。该研究标志着认知神经科学与机器学习交叉领域的重要进展,为发展便携式认知评估工具奠定了方法学基础。
生物通微信公众号
知名企业招聘