《Geriatrics & Gerontology International》:Virtual Reality–Based Cognitive Training to Prevent Cognitive Decline in Older Adults With Mild Cognitive Impairment: A Systematic Review of Randomized Controlled Trials
目的:系统评价虚拟现实(Virtual Reality, VR)认知训练对轻度认知障碍(Mild Cognitive Impairment, MCI)或相关前痴呆状态老年人的疗效、可行性及安全性的随机对照试验(Randomized Controlled Trial, RCT)证据。
方法:本系统评价遵循PRISMA 2020指南进行,并已在PROSPERO前瞻性注册(CRD420261290617)。研究人员检索了MEDLINE(通过PubMed)、Scopus、ScienceDirect和MDPI期刊数据库,并在Cochrane对照试验中心注册库(Cochrane Central Register of Controlled Trials, CENTRAL)进行了补充验证检索。纳入标准为2020年至2025年间发表的英文RCT,涉及年龄≥60岁并接受VR认知或认知-运动训练干预的成年人。结局指标包括认知与功能表现、依从性及安全性。
结果:共纳入8项RCT。VR干预与特定认知和功能领域衰退的维持或减缓相关,尤其表现在执行功能、记忆和视空间能力方面。效应在不同认知领域、沉浸水平及干预方案间存在差异。干预依从性总体较高,报告的不良事件少见且轻微,最常见为头晕或视觉疲劳;未报告严重不良事件。
结论:VR认知训练可能代表一种可行且耐受性良好的MCI老年人非药物干预手段。尽管证据提示其在维持认知功能方面具有潜在益处,但干预间的高度异质性及有限的地理多样性限制了更广泛的推广性。尚需开展采用标准化结局指标、更长随访期的大型多中心试验。
1 Introduction
全球人口老龄化代表关键的人口结构转变。世界卫生组织预测,60岁及以上人口将从2020年的10亿增至2050年的21亿。类似趋势亦见于诸多亚洲国家,如印度尼西亚老年人口占比达11.75%。在此背景下,长期照护仍以家庭为基础且高度性别化,女性——特别是女儿——常承担主要照护者角色。印度尼西亚针对痴呆老年人家庭照护者的质性证据揭示,污名化、照护知识匮乏及痴呆相关卫生服务可及性不足等持续性挑战,这些因素加重了照护者负担并破坏了照护连续性。
在这一老龄化人群中,轻度认知障碍(MCI)已成为普遍存在且临床意义重大的状态,机构化老年人中约21%受其影响。若缺乏有效管理,MCI与加速的功能衰退、依赖性增加及照护者负担加重相关。尽管传统非药物干预——如纸笔记忆练习、视频教育和小组讨论——显示出适度认知获益,但其长期疗效有限。这些方法常表现为被动参与和低生态效度,降低了其激发持续认知参与和现实功能相关性的能力。
虚拟现实(VR)作为有前景的非药物认知训练方法脱颖而出,其提供交互式且生态效度较高的学习环境。与传统视频或纸笔干预不同,VR使使用者能够主动参与模拟三维环境,这些环境反映日常生活活动,从而促进任务相关认知刺激。这种主动参与支持情境学习过程,对晚年情景记忆和执行功能尤为重要。此外,VR干预提供多感官反馈,激活视空间和执行神经回路,可能增强神经可塑性和MCI个体的认知韧性。
尽管具有潜在获益,VR在老年认知照护中的整合并非没有挑战。晕屏症(cybersickness),常表现为头晕、恶心或视觉不适,仍是首要顾虑,尤其对于可能已存在年龄相关前庭功能衰退的老年人。近期研究亦提示,单纯的感觉运动不匹配——在不伴随强烈视觉-前庭冲突且VR以坐姿、短时任务递送时——可能对晕动症结局影响有限。与头戴设备重量及长时间使用相关的身体不适亦有报告。值得关注的是,新兴证据表明这些不良效应可通过精心设计的方案予以缓解,包括缩短单次时长、坐姿训练及优化显示性能。
尽管越来越多证据支持VR干预的认知获益,其在MCI老年人中的可行性、耐受性和安全性仍存在不确定性。因此,本系统评价旨在综合RCT证据,以评价VR认知训练的有效性、依从性和安全性,为老年临床实践提供参考。
2 Methods
2.1 Systematic Literature Review
本研究采用系统文献综述设计,遵循2020年Preferred Reporting Items for Systematic Reviews and Meta-Analyses(PRISMA)指南。综述过程包括系统数据库检索、研究筛选、资格评估和数据提取,由两名评审员独立执行以增强方法学严谨性并减少潜在偏倚。本系统评价已在PROSPERO数据库前瞻性注册(CRD420261290617)。
2.2 Search Strategy
系统文献检索涵盖主要书目数据库(MEDLINE[通过PubMed]和Scopus)及特定出版平台(ScienceDirect和MDPI Journals)。此外,为确保RCT的全面覆盖,在Cochrane Central Register of Controlled Trials(CENTRAL)进行了补充验证检索。检索覆盖2020年1月1日至2025年3月31日发表的研究。检索最初于2025年3月进行,并于2026年3月6日使用相同预设日期限制重新运行以在修订过程中验证研究识别。检索策略结合受控词汇(如MeSH术语)与MCI、VR和RCT相关自由文本关键词,使用布尔运算符(AND, OR)跨概念组合检索词,并根据各数据库索引系统调整检索策略。
所有检索记录导出至文献管理软件,去重后进行筛选。除数据库检索外,还进行了纳入研究及相关综述的backward citation tracking,以及使用Scopus的forward citation检索以识别额外合格试验。
2.3 Eligibility Criteria
资格标准采用PICO框架制定。研究对象为年龄≥60岁、经标准化认知评估(如MMSE、MoCA或等效验证工具)确诊的MCI或相关前痴呆状态成年人。合格干预包括沉浸式、半沉浸式和沉浸式VR认知或记忆训练项目,前提是存在明确界定的认知训练成分。对照条件包括非VR对照,如常规照护、传统认知训练、健康教育、无VR体育锻炼或候补/无干预对照。
主要结局指标为全球或特定领域认知表现的变化(如记忆、执行功能、注意和视空间能力)。次要结局包括干预依从性和安全性结局,包括报告的不良事件如晕屏症或不适。
仅纳入2020年1月1日至2025年3月31日间发表的英文RCT。排除涉及确诊痴呆、阿尔茨海默病、严重认知障碍、神经系统疾病继发性认知障碍(如卒中、帕金森病或创伤性脑损伤)或仅专注物理康复而无认知成分的VR干预。
2.4 Study Selection and Data Extraction
两名评审员独立筛选标题和摘要以根据预设纳入标准评估资格,随后进行全文审阅以确认资格。分歧通过讨论解决,必要时咨询第三名评审员。使用标准化提取表提取数据,包括研究特征(作者、年份、国家、研究设计)、参与者特征、干预细节(VR系统类型、沉浸水平、持续时间和频率)、对照条件、结局指标和主要发现。
2.5 Quality Appraisal and Risk of Bias Assessment
纳入研究的方法学质量采用Joanna Briggs Institute(JBI)RCT关键评价清单进行评估。该工具评估随机化程序、分配隐藏、基线可比性、盲法、结局指标信度、随访完整性和统计分析方法适当性等关键领域。每项标准评定为"是"、"否"、"不清楚"或"不适用"。
鉴于VR干预的交互性质,部分研究无法对参与者和实施人员进行盲法,因此将其置于干预特征背景下考量而非作为固有方法学缺陷。总体评价结果见附录3(支持信息)。
2.6 Data Synthesis
由于研究设计、VR干预特征(如沉浸水平、内容和持续时间)和结局指标存在实质性异质性,未进行荟萃分析(meta-analysis),而是采用叙事综合(narrative synthesis)系统比较各研究发现。综合领域包括认知结局、干预依从性和报告的安全性/耐受性问题,尤其关注晕屏症和身体不适。该方法在考虑纳入试验间临床和方法学变异的同时,实现了对干预效应的结构化比较。
2.7 Use of Generative AI in Manuscript Preparation
手稿准备过程中,ChatGPT(OpenAI)仅用于辅助语言润色、结构组织和清晰度提升。该工具未用于生成原始数据、执行分析、确定资格、提取 db 放、评估偏倚风险或得出科学结论。所有输出均经作者批判性审阅、验证和编辑,作者对内容负全部责任。
3 Results
3.1 Study Selection
数据库检索共识别452条记录,去除78条重复后,374篇文章进入标题和摘要筛选。该阶段排除354条不符合资格标准的记录,20篇全文文章被评估,其中12篇因不合格研究设计(n=5)、不当干预(n=1)、年龄低于60岁(n=4)或非MCI人群(n=2)被排除。最终8项RCT符合纳入标准进入最终综合。
3.2 Study Characteristics
纳入的8项RCT于2020至2025年间发表,分布在五个地区:韩国(n=3)、台湾(n=2)、中国大陆(n=1)、中国香港(n=1)和土耳其(n=1)。共纳入611名参与者,单个研究样本量从21至293人不等。参与者主要为MCI或相关前痴呆状态老年人,包括主观认知下降和认知衰弱,按研究特定诊断标准定义。研究场景包括社区、门诊、长期照护和护理院环境。
3.3 Intervention Characteristics
所有纳入研究均实施VR认知或认知-运动训练干预,在沉浸水平、训练持续时间和干预内容上存在差异。五项试验使用头戴式显示器的完全沉浸式(fully immersive)VR系统,三项研究使用非沉浸式(non-immersive)平台,包括基于屏幕或投影的环境。
干预持续时间从4至12周,训练频率每周1至5次,单次时长20至60分钟,总次数8至36次。干预针对记忆、注意和执行功能等认知领域,常通过模拟日常生活活动实现。两项研究纳入联合认知-运动训练。对照条件包括常规照护、传统认知康复、健康教育、无VR体育锻炼或延迟干预对照。
3.4 Cognitive and Functional Outcomes
所有8项试验均报告了认知和功能结局,但结局领域和评估工具存在显著差异。总体而言,8项试验中6项报告VR干预后至少一个认知或功能领域有统计学显著改善。全球认知表现采用蒙特利尔认知评估(MoCA)和简易精神状态检查(MMSE)等标准化工具评估,4项试验报告干预后显著改善。
执行功能和注意结局使用连线测验(Trail Making Test)和Stroop评估等工具测量,3项研究显著改善。记忆相关结局包括言语学习和工作记忆,结果不一,部分研究报告显著改善而其他研究未观察到组间统计学差异。
功能结局包括日常生活活动(Activities of Daily Living, ADL)、步态和平衡,4项研究进行评估,其中3项报告显著改善。两项试验还报告了生活质量和情绪健康的改善。
3.5 Adherence and Safety
纳入试验中VR干预的依从性总体较高。6项研究报告出勤率或完成率超过80%,表明在老年人中具有良好的可行性和可接受性。5项研究明确报告了安全性结局。报告的不良事件主要为轻度且短暂,包括头晕、视觉疲劳、头痛、眼疲劳、恶心或疲劳。报告定量安全数据的研究中,VR相关不适比例从0.7%至3%不等。未报告严重不良事件或严重晕屏症。3项研究未提供明确安全性报告。
3.6 Quality Appraisal Results
JBI关键评价清单显示总体方法学质量为中等。所有研究报告了明确的纳入标准和随机化程序,但分配隐藏和盲法报告不一致。结局指标总体有效,脱落率低,3项试验未明确报告意向性分析(Intention-to-Treat, ITT)。总体局限性主要与盲法和样本量变异相关。
4 Discussion
本系统评价综合了8项RCT的证据,检验VR干预对MCI及相关状态老年人认知和功能结局的影响。总体而言,VR干预与特定认知领域的改善相关,尤其表现在执行功能、记忆和视空间能力方面,同时依从率总体较高且不良事件鲜少报告。然而,结局在不同研究间存在变异,反映了VR沉浸水平、干预持续时间和结局指标的异质性。这些发现共同提示VR可能是支持老年人认知训练的可行非药物方法,尽管效应强度和一致性在不同认知领域和干预设计间存在差异。
改善最一致地报告于执行功能、记忆和视空间能力,尤其见于采用沉浸式、任务导向VR环境的干预中。这些领域与目标导向行为和空间导航密切相关,当参与者与模拟日常生活活动交互而非被动接收信息时得以主动激活。先前研究表明,交互式VR任务可能通过要求动态环境中的并发认知处理和决策制定来支持执行控制。记忆相关获益同样归因于虚拟空间中的主动探索和导航,这可能增强老年人的编码和提取过程。视空间结局更常见于采用完全沉浸式系统的研究,其中具身交互和环境控制最大化,可能增强临场感(sense of presence)和任务参与。然而,证据亦表明视空间改善并非仅由视觉沉浸决定。主动导航和与环境的意义性交互——而非被动观察——可能在非沉浸式平台中也发挥关键作用。因此,沉浸水平差异可能影响哪些认知领域最强激活,更沉浸式系统有利于执行和视空间处理,而较不沉浸式平台支持重复性注意和记忆任务。
可行性和耐受性成为重要优势。大多数试验报告高依从率(>80%)和少见、主要为轻度的不良事件(如短暂头晕)。这些发现与既往研究一致,即VR干预在采用用户友好设计、短时程和渐进暴露方案时具有高度可接受性。尽管晕屏症在老年人群中仍是相关顾虑,但本评价中其低发生率可能反映了坐姿、任务导向环境的使用。然而,纳入研究中缺乏标准化VR不适测量工具,解释应谨慎。
本评价的额外观察是现有证据的地理集中性。8项纳入试验中7项在东亚(韩国、中国大陆、台湾和中国香港)进行,剩余1项在土耳其。这一模式与近期综述显示VR认知干预研究大量源于这些地区的机构一致。东亚医疗保健系统中数字健康技术在老年康复项目中的快速整合可能促成此趋势。此外,多项试验报告了国家或机构对数字健康创新的支持,这可能促进老年人群VR干预的开发。部分干预进行了文化调适,这可能进一步限制跨场景的可转移性。然而,当前证据基础的有限地理多样性可能限制发现跨不同医疗保健体系和社会文化背景的推广性。因此,未来需要在不同地区开展多中心试验,以加强VR认知干预在老年人中的全球证据基础。
另一项跨纳入试验的方法学挑战涉及对照条件的有效性和VR干预中实施盲法的困难。由于VR训练涉及高度交互且视觉独特的环境,参与者和治疗师通常知晓分组分配,在多数试验中难以实现完全参与者盲法。这一局限性在行为和技术辅助干预中常见,可能引入表现和期望偏倚。多项研究尝试通过标准化对照条件如传统认知训练、常规照护或延迟干预对照来解决此局限性。然而,VR与非VR活动间参与水平的差异仍可能影响结局,尤其当沉浸式环境增加训练期间的动机或新异效应时。当参与者盲法不可行时,评估者盲法在认知结局评估中尤为重要,以减少检测偏倚。未来试验应优先采用评估者盲法设计、具有可比认知任务的积极对照组,以及明确标准化的干预方案,以提高VR认知训练效应的内部效度和可解释性。
临床层面,VR通过安全模拟日常生活活动提供生态效度高的任务导向认知训练。这一方法对于存在活动限制或环境接触受限的老年人尤为宝贵。将VR整合入社区或长期照护环境可能通过提供结构化、可重复的认知-功能刺激同时保持安全和监督,来补充传统干预。
本评价存在若干局限性。首先,纳入试验在VR系统、干预内容、持续时间和结局指标方面存在实质性异质性,排除了定量综合。其次,多项研究受限于小样本量和相对较短的干预期,可能限制长期效应的评估。第三,东亚研究的主导地位可能限制发现向其他医疗保健体系和社会文化背景的推广性。第四,对照条件严谨性变异和不完全盲法可能影响效应估计。
5 Conclusion
本系统评价表明,基于VR的干预与MCI老年人特定认知和功能领域衰退的维持或减缓相关,具有总体较高的依从性和可接受的安全性特征。尽管认知效应在不同领域和干预设计间存在变异,沉浸式和任务导向方法对执行和视空间参与似乎尤为相关。重要的是,可行性和耐受性成为关键优势,支持VR整合入老年和护理实践的潜力。然而,当前证据基础的地理集中性和实质性干预异质性限制了更广泛的推广性。未来研究应优先开展采用标准化结局指标、优化训练方案和更长随访期的大型、设计严谨的多中心试验,以阐明VR在维持老年人群认知功能中的作用。