《JMIR Rehabilitation and Assistive Technologies》:Eye-Tracking Technologies for Cognitive Assessment After Acquired Brain Injury: Systematic Review
背景:获得性脑损伤(acquired brain injury,ABI)是一个异质性总括术语,涵盖创伤性与非创伤性病因,并且常与持续性认知功能障碍相关。传统神经心理学评估仍是临床评价的核心,但在存在运动障碍、失语、耐力下降或觉醒水平波动的个体中,其可行性与测量精度可能受限。眼动追踪提供了一种客观、低负担的方法,可在任务参与过程中量化注视行为,并可能提供认知的补充性过程水平标志。
目的:本研究旨在系统整合将眼动追踪范式作为获得性脑损伤认知评估主要方法的证据,并按认知领域、范式及临床可解释性总结研究发现。
方法:研究人员开展了一项符合 PRISMA(系统综述与荟萃分析优先报告条目,Preferred Reporting Items for Systematic Reviews and Meta-Analyses)2020 规范的系统综述,并在 PROSPERO 注册研究方案(CRD420251038768)。研究人员检索了 PubMed、Web of Science、Cochrane Library、Embase、EBSCOhost、PsycINFO 和 Scopus,自建库起至 2025 年 4 月 10 日。纳入经同行评议的英文研究,研究对象为儿童或成人获得性脑损伤患者,且眼动追踪为主要评估方式,用于量化至少 1 个认知领域或具有临床相关性的认知-交流过程。2 名评审者独立筛选研究、提取数据,并使用与研究设计相适配的工具评估方法学质量,包括 Risk of Bias 2、非随机干预研究偏倚风险工具(Risk of Bias in Non-Randomized Studies of Interventions)、诊断准确性研究质量评价工具 2(Quality Assessment of Diagnostic Accuracy Studies 2)和 Newcastle-Ottawa Scale。由于范式及结局定义存在异质性,因此实施了结构化叙述性综合。
结果:共有 27 项研究符合纳入标准(N=872;女性 n=354,男性 n=518),其中多数证据来自轻度创伤性脑损伤队列,较少研究涉及卒中、混合病因及意识障碍。跨认知领域来看,反向眼跳(antisaccade)及相关范式通常与抑制控制和执行功能差异相关,而预测性追踪(predictive tracking)、平滑追踪(smooth pursuit)及目标消隐(target-blanking)范式常可捕捉注意预测与时序加工的改变。虚拟现实(virtual reality,VR)自由观看范式识别出卒中相关忽略患者在视空间探索中的不对称性,而基于注视的人机接口方法则在部分意识障碍患者中显示出高于机会水平的任务表现。相较于传统评估的增量效度证据尚不一致,且往往仅为间接证据;安全性报告亦较少。总体而言,证据确定性普遍较低,其限制主要来自样本量小、横断面设计,以及采集流程、指标体系和分析流程的异质性。
结论:眼动追踪显示出作为 ABI 后特定认知相关行为量化的辅助性、过程水平方法的潜力,尤其是在针对抑制控制与预测性注意的范式中。现有证据尚不足以支持广泛的诊断性结论,亦不足以支持其常规替代传统神经心理学评估。未来研究应优先推进范式与报告标准的协调统一、分类模型的外部验证、纵向设计,以及明确的可行性与安全性报告,从而阐明眼动追踪何时能够为精准神经康复提供增量性临床价值。
Introduction
Background
获得性脑损伤(acquired brain injury,ABI)是指出生后发生、且非遗传性或先天性病理所致的脑损伤总称,主要包括创伤性脑损伤(traumatic brain injury,TBI)与非创伤性脑损伤(nontraumatic brain injury,nTBI)。文章指出,ABI 是全球重要公共卫生问题,具有高发病率与高致残率,可在物理、代谢及神经功能层面破坏脑正常活动,并导致长期认知障碍与运动功能缺损。中重度 TBI 患者在慢性期常持续存在记忆、注意、加工速度及执行功能障碍,同时还可能伴有轻偏瘫、共济失调及姿势异常等神经运动问题,这些损害进一步影响步态稳定性、精细动作协调及日常生活活动能力。随着 ABI 康复逐渐向技术辅助干预发展,临床对于能够敏感反映变化、适用于不同场景且可在任务执行过程中实时捕捉表现的评估工具需求日益增强。
眼动追踪技术因具备较高时间分辨率与空间分辨率,被认为适于检测与 ABI 功能缺损相关的细微眼动异常,并可在缺乏随意运动控制的患者中作为辅助性交互界面恢复交流能力。文中说明,眼动追踪通常借助红外(infrared,IR)摄像机与光源记录瞳孔及角膜反射,再将其转换为可反映多种认知状态的数据流。当前可用设备涵盖实验室高精度头部固定系统、现实环境设备、虚拟现实(virtual reality,VR)或增强现实头显,以及更易获得的基于摄像头的追踪器。眼动追踪可测量注视(fixation)、眼跳(saccade)、瞳孔测量(pupillometry)、平滑追踪、集合运动(vergence)、眨眼及注视路径等关键参数,并已应用于注意、记忆、执行功能、语言加工和阅读流畅性评估,也在神经退行性疾病早期诊断中显示前景。对于 ABI 人群,该技术尤其适用于轻度创伤性脑损伤(mild traumatic brain injury,mTBI)后的眼动功能障碍检测,也可用于意识水平判断及卒中后视觉探索空间偏倚分析。
Rationale, Objective, and Theoretical Framework for Investigating Eye Tracking in ABI Cognitive Assessment
作者认为,尽管传统神经心理学评估仍是 ABI 后认知评价的核心,但在运动障碍、失语、耐力下降或觉醒波动人群中,施测可行性和解释精度均可能受限;对于 mTBI 常见的细微缺陷,传统工具的敏感性也可能不足,且重复测量易受练习效应影响。相比之下,眼动追踪能够通过注视时长、眼跳模式及瞳孔反应等指标,更直接、系统且客观地反映注意、记忆和执行控制等认知功能相关的神经加工过程。文章进一步强调,ABI 具有显著病因学与临床表型异质性,包括 TBI、卒中、缺氧缺血性损伤及意识障碍(disorders of consciousness,DoC),且严重程度与恢复阶段差异会影响眼动范式选择及结果解释,因此有必要在不同 ABI 亚群与目标认知领域层面整合现有证据。
在理论基础方面,作者指出眼动控制与认知功能之间具有紧密神经生物学联系。反向眼跳范式依赖额-纹状体(frontostriatal)环路及执行性抑制机制;平滑追踪和预测性追踪则涉及小脑与顶叶系统,支持时序、预测及注意分配。注视稳定性、注视变异性及瞳孔动力学并不代表单一构念,而是可指示认知加工不同成分。因此,只有当具体范式与指标被置于明确神经认知靶点下解释时,眼动追踪才能作为观察认知过程水平变化的有效窗口。
Methods
Protocol and Reporting Standard
本研究遵循 PRISMA 2020 指南开展与报告,并预先在 PROSPERO 注册,以提高透明度、可重复性并降低选择性报告风险。作者说明,任何偏离原注册方案之处均在文中记录与论证;在同行评议反馈后,研究团队还更新了 PROSPERO 记录,以澄清比较条件要求、可纳入病例系列的条件以及不同研究设计对应的偏倚风险评估工具。
Review Question Framework (PICO)
研究采用适用于诊断与评估技术的 PICO 框架界定问题。研究对象包括不同病因、严重程度及恢复阶段的儿童和成人 ABI 患者;指标检测方式为以眼动追踪作为主要评估手段,用于量化认知或临床相关认知-交流过程;比较条件并非必需,若存在则可包括健康对照、ABI 亚组、个体内前后比较及传统神经心理测验;结局指标包括与认知相关的眼动参数,如反向眼跳潜伏期、错误率、预测性追踪指标及视空间加工相关的注视或探索指数,以及明确报告的诊断或分类效能指标。该框架用于指导研究筛选、数据提取与结果综合,并减少将眼动追踪误判为干预措施的风险。
Eligibility Criteria and Operational Definitions
纳入研究须为英文、同行评议全文文献,对象为任意病因、严重程度及恢复阶段的 ABI 儿童或成人,病因包括 TBI、卒中、缺氧缺血性损伤、感染性或炎症性 ABI,以及 ABI 后 DoC。眼动追踪必须作为主要评估方式,用于量化认知功能。作者对“主要”进行了操作性界定,即眼动范式及其衍生眼动指标在认知评估目标中处于核心位置,并用于表征至少 1 个认知领域或具有临床意义的认知-交流构念。目标认知领域包括注意、执行功能、记忆与工作记忆、视空间探索与忽略相关过程、语言及认知-交流过程、社会认知范式,以及用于检测 DoC 指令遵循、随意控制或意识的注视范式。排除标准包括研究方案、会议摘要、学位论文、综述、动物研究、单病例报告,以及仅用于设备验证、可用性测试或缺乏明确认知解释框架的眼动研究。
Information Sources and Search Strategy / Study Selection / Data Extraction and Data Items
作者检索了 7 个数据库,自建库起至 2025 年 4 月 10 日,不设发表日期限制,并结合主题词与自由词构建检索式,覆盖眼动追踪、眼动指标、认知、认知评估以及 ABI 相关病因。为减少漏检,还筛查了纳入研究及相关综述的参考文献,并对关键哨点研究进行前向引文追踪。文献筛选由 2 名评审者独立进行,包括标题摘要筛选和全文审查,并通过讨论或第三评审者裁决解决分歧,同时以 Cohen κ 统计量量化一致性。数据提取同样由 2 名评审者独立完成,内容涵盖研究设计、样本量、人口学信息、ABI 病因与严重程度、恢复阶段,以及设备型号、采样率、校准程序、头部固定条件、测试环境、任务说明、刺激类型、试次结构、并发认知负荷、主要与次要眼动指标、比较条件、统计结果、可行性与数据质量信息及安全性报告。
Risk of Bias Assessment / Data Synthesis and Effect Measures / Certainty of Evidence
偏倚风险评估依研究设计选用不同工具:随机对照试验采用 Risk of Bias 2;非随机干预研究采用 ROBINS-I;诊断或分类研究采用 QUADAS-2;观察性队列或病例对照研究采用 Newcastle-Ottawa Scale(NOS)。这些评估不作为排除依据,而是纳入综合解释与证据确定性判断。由于预计不同范式、指标及 ABI 亚群之间存在明显异质性,作者预先设定以叙述性综合为主,按认知领域与眼动范式组织结果,并尽可能按病因和恢复阶段进一步分层。仅当至少 3 项研究使用足够可比的范式、相同结局指标且提供充分统计数据时,才考虑实施荟萃分析。证据确定性依据 GRADE(Grading of Recommendations, Assessment, Development, and Evaluations)原则,从偏倚风险、不一致性、间接性、不精确性及发表偏倚等方面进行评价。
Results
Study Selection
数据库检索共获得 362 条记录,去重并排除非英文记录后,355 条进入标题摘要筛选。经过初筛后,有 294 篇文献进入全文获取流程,其中 289 篇完成全文资格评估。最终,27 项研究符合预设纳入标准并进入定性综合。全文排除的主要原因包括:眼动追踪未用于量化认知、研究对象并非 ABI 或无法分离 ABI 数据、眼动追踪不是主要评估手段,以及研究重点仅为技术验证或可用性测试而缺乏临床认知解释。
Characteristics of Included Studies and Participants
纳入证据在临床人群与方法学路径上均具有异质性,且以 TBI 队列,尤其是 mTBI、脑震荡及持续性脑震荡后症状人群为主,常见于军事或运动样本。共有 872 名受试者纳入,女性 354 例、男性 518 例,但性别并未在所有研究中持续报告或作为效应修饰因素分析。中重度 TBI 研究数量较少,多采用病例对照设计,关注认知-交流或高级整合过程。卒中主要表现为 1 项使用 VR 自由观看范式研究视空间忽略的文献;DoC 则由基于注视的人机交互(human-computer interface,HCI)范式研究构成,用于探测指令遵循或意识。另有 1 项混合病因研究纳入 TBI 与卒中患者,考察与阅读缺陷相关的眼动康复。儿童证据极为有限,仅 1 项纵向研究评估轻型闭合性颅脑损伤儿童在急性期、3 个月及 6 个月时的眼跳表现与记忆结局,提示发育因素及年龄亚组效应可能影响眼动轨迹,因此儿童结论不宜外推至更广泛 ABI 人群。
Results by Cognitive Domain and Clinical Use Case
由于范式与结局定义高度异质,研究未实施定量合并,而按认知领域和临床应用进行叙述性总结。在执行功能与抑制控制方面,证据主要来自反向眼跳及相关范式。多项成人 mTBI 与慢性 TBI 研究显示,相较对照组,患者反向眼跳潜伏期延长和<或>错误率升高,提示抑制控制与执行调节受损;慢性队列中,这类异常在需要抑制反射性眼跳或持续抑制控制的任务条件下尤为明显。部分研究还显示,眼动指标可捕捉到并不一定在全局认知筛查量表中体现的损害。某探索性研究将反向眼跳表现与弥散指标及 Stroop 干扰表现相结合,发现急性 mTBI 中较长潜伏期与更高症状负担、更差干扰控制及胼胝体压部白质完整性指标相关,支持眼动抑制指标可能反映执行控制及其神经生物学基础。年龄与损伤严重程度亦为重要背景因素:既往 mTBI 史者中,年龄较大与眼跳反应更慢及抑制表现下降相关;中重度 TBI 常显示比轻度 TBI 更广泛的损害谱,但效应大小受任务选择、记录参数与分析定义影响。
在工作记忆与认知负荷方面,证据较少,主要来自嵌入眼动结果的 n-back 范式及相关负荷操控任务。总体上,随着认知负荷增加,眼动障碍更易显现。慢性 TBI 队列在高负荷条件下常出现眼跳潜伏期延长和错误指标恶化,且损伤越重者受影响越明显,提示负荷操控可能提高眼动指标对认知脆弱性的敏感性。某临床导向的多模态评估还报告,特定眼跳指标有助于区分慢性 mTBI 与对照,而常规神经心理测验在同一场景中的区分度较不稳定。尽管该领域研究数目有限,但整体方向支持认知负荷会放大执行与注意需求,并在眼动控制中表现出来。
注意、预测控制与注意时序是证据最丰富的领域,主要涉及平滑追踪、预测性视觉追踪、目标消隐及 gap 范式。多项研究报告,mTBI 或脑震荡后症状组在需要预测目标轨迹或补偿视觉输入缺失时,平滑追踪或视觉追踪表现发生改变。采用可预测平滑追踪范式的研究发现,轻度 TBI 组较对照组具有更差的目标预测能力、更大的眼位误差和变异性,且追踪相关指标与涉及注意和执行功能的言语学习测量存在相关。在结合脑磁图(magnetoencephalography,MEG)的预测追踪任务中,缺陷在 gap 条件下最为明显,提示当范式减少连续感觉反馈、提高自上而下预测需求时,预期性控制可能更易受损。另有脑震荡监测研究显示,在伤后 2 周内,同一个体视觉追踪指标变化与症状负担呈中等至强相关,而简单反应时指标虽然也出现减慢,但与症状量表关系较弱。这些结果提示,在部分脑震荡情境中,追踪范式所反映的预测时序与持续注意成分,可能比简单反应指标更贴近症状谱。然而,并非所有研究都观察到稳健组间差异:有研究显示,尽管影像学存在异常且注意相关反应时变慢,脑震荡组视觉追踪表现与对照大体相当;另一些研究则发现,行为性眼动测量在区分慢性 mTBI 与对照方面不如影像学指标敏感,说明眼动追踪对注意异常的表征高度依赖具体范式与结局指标。
在视空间探索与忽略检测方面,证据虽有限,但具有明确临床启示。1 项 VR 博物馆自由观看研究显示,伴空间忽略的卒中患者相较对照存在侧化注视与头部朝向不对称,且该方法能够检测部分未被传统测验稳定捕捉到的异常探索模式。这提示沉浸式、自然情境化范式在识别空间偏倚方面可能具有增量价值,但目前证据尚局限于单一研究,外推性有限。
在认知-交流与社会认知方面,3 项研究采用结构化注视行为任务评估语言与社会相关视觉注意。视觉世界(visual-world)范式研究语音-手势整合发现,两组均能从有意义手势中获益,但中重度 TBI 组的促进效应减弱,提示其在语言加工中对多模态线索的整合能力下降。针对增强与替代交流(augmentative and alternative communication,AAC)显示界面的研究发现,网格式界面较情景式界面需要更高视觉努力,且 TBI 患者整体注视模式效率更低,反映信息提取效率下降及加工负荷增加。另 1 项自由观看研究聚焦情境照片中的参与线索,结果显示两组均能快速定向至人物,并依据任务相关参与内容调整注视模式,组间差异有限,说明某些社会注意成分在特定任务要求与刺激属性下可能相对保留。整体来看,眼动追踪可用于量化认知-交流情境中的加工效率及线索整合差异,但研究数量少、任务特异性强,限制了广泛结论的形成。
DoC 领域有 2 项研究使用基于注视的范式探查指令遵循与意识。在一种面向 DoC 的注视追踪 HCI 方法中,部分患者在一个或多个结构化任务中的表现高于随机水平,提示该工具可能补充床旁诊断并减少误分类,尤其有助于识别保留有意义指令遵循能力的患者。另一项研究将注视任务与神经生理指标结合,提示多模态特征可能与严重 ABI 人群的临床状态分类相关。尽管受样本量小、觉醒波动及场景可行性限制,这两项研究均支持在严重意识障碍评估中继续探索眼动 HCI 作为辅助评估工具的价值。
Incremental Validity Relative to Conventional Assessment / Safety, Feasibility, and Data Quality Reporting / Methodological Quality and Risk of Bias
关于相较传统神经心理测验的增量效度,直接证据有限,因为多数研究未将增量效度设为主要分析目标,且比较工具在不同队列和场景中差异较大。尽管如此,研究仍呈现出若干趋势:与注意预测和执行抑制紧密相关的眼动指标,常与症状负担及执行测验表现有关;某些多模态或嵌入式任务研究显示,在传统认知测验区分度有限的情境下,眼动指标可能有助于组别判别或分类;但也有研究指出,基于症状或前庭-眼动筛查的措施对某些具体目标优于计算机化眼动平台。因此,现有证据仅支持在特定范式与特定人群中谨慎考虑其附加价值,而不足以证明其普遍优于常规评估。
安全性报告总体不足,仅极少数研究明确报告无不良事件,大多数研究未以可清晰分类的方式报告安全信息。可行性报告虽稍多,但也不完整;近半数研究提供了关于校准失败、设备故障、测试未完成或分析纳入情况的信息。已报告的困难包括 VR 忽略评估中的疲劳与校准失败、语言加工研究中的设备相关排除、重度 TBI 队列中因身体障碍未能完成常规测试,以及前瞻性脑震荡研究中因眼动记录不可用导致分析样本量变化。此外,若干范式需头部固定、专门设备及受控测试环境,这可能限制其在常规临床环境中的推广。
方法学质量方面,单项随机对照试验总体被评为“存在一些担忧”;3 项诊断或分类研究在 QUADAS-2 下均显示较高偏倚风险,主要问题包括非连续或志愿者取样、数据驱动的预测因子和阈值选择,以及参考标准与 ABI 认知状态分类不完全一致。19 项以 NOS 评估的观察性研究中,6 项为良好、12 项为一般、1 项为较差,提示比较性与暴露<或>结局测量方面存在反复出现的方法学局限。总体证据确定性在多数认知领域均为很低,诊断或分类结局仅达到低水平,主要降级原因包括非随机设计、小样本、范式和指标异质性高,以及缺乏外部验证。
Discussion
Principal Findings
作者综合指出,眼动追踪作为 ABI 后认知或认知-交流过程主要评估方法,能够捕捉与执行性抑制、注意预测及认知负荷相关的可测量注视控制和视觉注意差异。当前证据最集中于慢性或持续症状性 mTBI,而中重度 TBI、卒中、缺氧缺血性损伤及 DoC 的证据相对稀少,且方法学差异明显。相较传统神经心理学测试的增量效度总体表现不一致,多为间接证据;安全性和可行性报告亦不充分,因此难以对其临床耐受性与规模化实施作出确定判断。
Interpretation and Clinical Implications
文章强调,眼动结果在临床转化时应区分两个层面:其一是偏向感觉运动性眼动控制的指标,如共轭注视稳定性、追踪增益和基础追踪精度;其二是与高级认知过程耦合更紧密的范式,如反向眼跳、消隐或 gap 条件下的预测性追踪以及认知负荷操控任务。前者可反映视觉系统及其支持网络受损,后者则更可能提供关于执行抑制、注意预测与控制过程的过程水平窗口。但作者同时指出,技术上“异常”的眼动模式并不自动等同于高级认知受损,反之亦然,因此临床解释必须依赖任务需求、分析定义及目标构念之间的精确匹配。
从生物标志物角度看,作者主张保持谨慎。眼动指标具有作为候选行为生物标志物的潜力,但现阶段尚缺乏足够标准化,难以支持广泛临床应用或宣称常规优于传统评估。特别是在分类分析中,不少研究采用同一样本内阈值选择、非连续抽样或与认知状态分类不完全匹配的参考标准,削弱了结果的可推广性。就近期临床角色而言,眼动追踪更适合作为补充性工具,而非替代手段。其在脑震荡和持续症状队列中,可能特别适合用于短时间窗内量化视觉注意与控制成分,并在需要重复测量、避免练习效应时提供优势。VR 等更自然化、沉浸式实现方式还可能提高生态效度,但设备成本、空间需求、校准程序、头部固定要求及专业人员需求,都是其常规推广的重要障碍。此外,精神症状、睡眠障碍、疼痛、药物使用及人口学因素均可影响眼动指标,这些混杂因素若未被测量和分析控制,可能夸大其认知特异性解释。
Translation to Neurorehabilitation and Future Directions
作者认为,当前大多数研究证明的是关联性、组间区分能力或可行性,而非眼动追踪能够改善临床决策或患者结局,因此关于临床实用性的主张仍应视为初步。尽管如此,眼动追踪仍有若干重要发展方向:其一,可作为精准康复中的客观高频行为指标,用于纵向跟踪并与个体化康复靶点相连接;其二,针对眼跳、平滑追踪与注视的量化和分析方法学工作,为跨设备、跨范式指标统一奠定基础,有助于未来多中心可比性与常模数据库建设;其三,将眼动追踪与影像学、神经生理学及症状轨迹结合的“数字生物标志物”路径,可能增强解释力,但前提是测量有效性、混杂控制与可重复性得到严格保证。对于 DoC、卒中及语言相关认知-交流障碍,文章认为仍需更多平衡病因学分布的研究,以改善目前证据过度集中于慢性 mTBI 的局面。
Strengths and Limitations
本综述的优势在于,围绕认知领域与临床使用场景构建了结构化综合框架,并结合与研究设计相匹配的偏倚风险工具及明确的证据确定性评价体系。广泛纳入不同眼动范式,包括传统眼动任务、嵌入式认知负荷评估、VR 范式及 HCI 路径,提高了覆盖面与临床相关性。其局限性则包括:现有研究在范式、结局定义、采集流程及分析管线方面高度异质,无法进行定量合并;多数研究为横断面且统计效能不足;证据主要来自慢性 mTBI 与选择性样本,限制了对其他 ABI 病因与一般临床环境的推广;安全性与可行性报告不完整;分类模型常在同一数据集中开发并验证,易高估诊断性能。
Conclusion
综上,眼动追踪技术在 ABI 后用于量化与认知过程相关的视觉注意及眼动控制特定成分方面显示出有前景的辅助价值。目前证据最充分的领域是 mTBI 人群中的抑制控制、预测性追踪及认知负荷相关范式,而卒中、缺氧缺血性损伤和 DoC 相关证据仍处于初步阶段,且方法学多样。现阶段文献尚不足以支持眼动追踪常规优于传统神经心理学评估的广泛结论。更为稳健的解释是:在特定范式、特定人群且具备标准化采集、透明报告及适当混杂因素评估的条件下,眼动追踪可能提供具有临床意义的增量信息。未来研究应优先推进范式与报告标准统一、分类阈值的外部验证、纵向设计,以及明确的可行性与安全性报告,以界定眼动追踪在精准神经康复路径中“何时适用、适用于谁”。