基于视频行为分析的非人灵长类注意力与认知参与度评估:一种跨任务的高精度识别方法

【字体: 时间:2025年10月11日 来源:Journal of Neuroscience Methods 2.3

编辑推荐:

  本研究针对非人灵长类动物认知状态视频评估的难题,开发了一种集成DeepLabCut姿态估计与三维重建的分析流程,通过头部朝向和手腕屏幕距离量化注意力(Attentiveness)和屏幕参与度(Screen Engagement),实现了>90%的任务分类准确率,为神经行为学研究提供了可扩展的视频诊断工具。

  
在行为神经科学研究中,如何通过可观测的行为来精确量化内在的认知状态一直是个核心挑战。特别是注意力和认知参与度这类核心认知功能,其异常不仅见于注意缺陷障碍(ADHD),还广泛存在于精神分裂症、抑郁症等主要神经精神疾病中。传统研究方法多依赖于侵入式设备(如头戴式眼动仪)或受限行为环境(如固定观察箱),难以在自然行为场景下实现长期、无干扰的认知状态监测。尽管近年来视频式机器学习工具(如DeepLabCut、SLEAP等)在动物姿态估计方面取得显著进展,但这些技术多集中于运动模式分割,尚未有效转化为认知状态的定量指标。
针对这一瓶颈,来自范德比尔特大学心理学系的研究团队在《Journal of Neuroscience Methods》上发表了一项创新研究,他们开发了一套集成视频分析流程,通过双相机系统对执行认知任务的非人灵长类动物(NHP)进行视频监测,实现了对注意力(Attentiveness)和屏幕参与度(Screen Engagement)的帧级量化,并能以超过90%的准确率区分不同认知任务。该研究为视频行为分析在认知神经科学中的应用提供了重要方法论突破。
研究团队采用的关键技术方法主要包括:1)使用双相机(e3Vision cameras)以1600×1200分辨率、30fps采集视频数据;2)通过DeepLabCut(DLC 2.3.10)对11个身体部位(鼻、眼、肘、腕、指关节等)进行标记和姿态估计,训练基于ResNet-50的网络模型;3)利用MATLAB进行二维数据后处理(置信度过滤、速度滤波、插值)和三维坐标三角测量;4)通过头部偏航角(yaw)和手腕-屏幕距离设定个体化阈值,分类注意力和屏幕参与状态;5)采用随机森林(Random Forest)和K均值聚类(K-means)对时间窗口内的行为指标进行任务分类。实验对象为4只恒河猴(Macaca mulatta),在居家笼舍环境的触摸屏kiosk站执行三类认知任务。

3.1. Attentiveness and screen engagement vary between cognitive tasks

通过31次实验会话的分析发现,注意力水平在任务间保持稳定(约90%,p=0.221),而屏幕参与度则呈现显著差异(p=3.476×10-7)。迷宫学习任务(MZ)和努力控制任务(EC)的屏幕参与度均超过50%(MZ1:64.0%、EC:58.8%),而工作记忆任务(WM)则较低(WM1:41.1%),这与各任务的操作需求一致——迷宫和气球任务需连续触摸屏幕,而工作记忆任务仅需单次选择。

3.2. Classification of performing different cognitive tasks

采用机器学习分类发现,随机森林算法在18秒时间窗口(540帧)内达到91%的分类准确率,显著优于K均值聚类(57.5%)。特征重要性分析显示屏幕参与度(0.778)的贡献是注意力(0.222)的3倍以上。混淆矩阵显示迷宫任务分类准确率最高,努力控制任务最低。
研究结论表明,该集成分析流程能够从视频中高效提取认知状态指标,且具有高时间分辨率(最低2秒窗口)和跨任务区分能力。注意力评分适于识别个体间或状态间的注意力差异,而屏幕参与度能有效反映任务特异的交互强度。该方法无需侵入设备即可实现自然行为场景下的认知监测,为精神疾病模型的行为表型鉴定、药物效应评估及认知神经机制研究提供了可扩展的工具。未来可结合多视角视线追踪、行为选择模式及神经记录数据,进一步深化对认知-行为-神经环路关系的理解。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号