UDS 2.0与3.0神经心理测验套件的测量等值性及跨种族/族裔的认知因子结构验证

【字体: 时间:2025年09月17日 来源:Alzheimer's & Dementia 11.1

编辑推荐:

  本研究发现美国阿尔茨海病协调中心(NACC)统一数据集(UDS)2.0与3.0版本神经心理测验套件支持四因子认知结构(情景记忆、注意、执行功能、语言),并证实其在不同种族/族裔群体间存在部分标量等值性(partial scalar invariance)。研究强调跨群体比较时需校正非等值测量参数,尤其语言与注意领域,对推动认知老化研究和临床实践具重要意义。

  

背景

随着全球人口老龄化加剧,理解生物、社会文化和环境因素对认知老化的影响变得尤为重要,特别是在不同种族和族裔背景的个体中。准确测量认知能力是实现这一目标的基础,而测量工具在不同群体中的等值性(measurement equivalence)是保证结果可比性的前提。目前大多数神经心理学评估工具都是在相对同质的人群(如美国出生、高教育水平、单语英语使用者、非西班牙裔白人)中开发和验证的,这可能导致对未覆盖群体的认知能力估计偏差。

测量偏差(measurement bias)是指在不同群体中,具有相同潜在能力水平的个体在测试得分上出现系统性差异。测量等值性(measurement invariance)或测量等价性(measurement equivalence)则意味着测试在不同群体中以相同的方式测量认知结构,使得得分可以直接比较。以往关于种族和族裔群体的测量等值性研究结果不一,有的研究支持标量等值(scalar invariance),有的则发现部分标量等值(partial scalar invariance),特别是在语言领域。

本研究旨在评估美国阿尔茨海病协调中心(NACC)统一数据集(UDS)2.0和3.0版本神经心理测验套件的维度结构及其在不同种族/族裔群体中的因子等值性。通过结合UDS 2.0和3.0的数据,并利用UDS交叉walk样本,研究扩大了样本规模和多样性,增强了模型的泛化能力。

方法

参与者

研究数据来源于2025年3月的NACC UDS数据冻结,包括2005年至2025年间32个阿尔茨海病研究中心(ADRCs)收集的基线访视数据。参与者为认知正常或经UDS共识临床诊断为轻度认知障碍(mild cognitive impairment)或痴呆(dementia)的个体,且仅纳入以英语为主要语言的参与者。最终样本包括49,895名参与者,随机分为学习样本和验证样本。

种族/族裔

种族/族裔类别包括白人(White)、黑人(Black)、拉丁裔(LatinX)和亚裔(Asian)。采用预定的优先顺序将自报多个种族/族裔身份的参与者编码为单一类别,其中拉丁裔优先,其次为黑人、美洲原住民和亚裔。由于美洲原住民样本量小,未纳入分析。

NACC UDS测量

UDS 2.0和3.0版本中的神经心理测验包括逻辑记忆(Logical Memory)、数字广度(Digit Span)、数字符号编码(Digit Symbol Coding)、轨迹制作测验(Trail Making Test)、波士顿命名测验(Boston Naming Test)、多语言命名测验(Multilingual Naming Test)、类别流畅性(Category Fluency)和字母流畅性(Letter Fluency)等。通过UDS交叉walk研究(n=935)和共有项目,将2.0和3.0版本的数据连接起来。

数据分析

测量和处理:对原始变量进行Blom转换,使其符合正态分布并建立标准化尺度。采用验证性因子分析(confirmatory factor analysis, CFA)比较多个备选模型的拟合度,包括单因子、双因子、三因子、四因子和五因子模型。模型拟合指标包括比较拟合指数(CFI)、Tucker-Lewis指数(TLI)和近似均方根误差(RMSEA)。缺失数据采用全信息最大似然法处理。

测量等值性:使用多组CFA评估测量等值性,包括构形等值(configural invariance)、弱等值(metric invariance)和强等值(scalar invariance)。通过迭代过程识别非等值截距,建立部分标量等值模型。同时评估UDS 2.0和3.0版本对应测验的测量等值性。

敏感性分析:在仅包含认知正常参与者的样本中重复测量等值性分析,并评估非英语测试者的影响。

结果

样本特征

总样本包括53,382名参与者,其中57.3%为女性,平均年龄71.1±10.4岁,平均受教育年限15.8±7.7年。种族/族裔分布为亚裔2.8%、黑人14.9%、拉丁裔9.4%、白人72.9%。临床诊断分布为认知正常45.6%、轻度认知障碍22.4%、痴呆31.9%。排除非英语测试者后,最终样本为49,895人。

最佳拟合模型

在多个备选模型中,四因子模型(情景记忆、注意、执行功能、语言)显示最佳拟合度。该模型包括字母流畅性在语言和执行功能因子上的交叉载荷,以及先验的残差结构。模型拟合指标在学习样本和验证样本中均表现良好(CFI=0.98, TLI=0.98, RMSEA=0.03)。五因子模型(包含视觉空间因子)未显著改善拟合度。

测量等值性

种族/族裔群体:多组CFA支持部分标量等值性。具体而言,所有四个认知因子均存在等值和非等值截距。情景记忆因子中4/7的观测变量、注意因子中2/4的变量、执行功能因子中4/6的变量以及语言因子中5/6的变量存在非等值截距。语言和注意领域的非等值截距较多,其中蔬菜流畅性(vegetable fluency)的非等值性尤为明显。未校正测量非等值性会导致白人组的语言能力被低估,黑人组的语言能力被轻微低估,而亚裔组的语言能力被轻微高估。

UDS版本:UDS 2.0和3.0版本的对应测验(如逻辑记忆与Craft故事、数字广度与数字跨度测验、波士顿命名测验与多语言命名测验)具有等值的测量特性,表明这些测验在测量认知因子时可以互换。

敏感性分析

在仅包含认知正常参与者的样本中,部分标量等值性仍然成立,但字母流畅性而非类别流畅性显示出较强的测量非等值性,主要影响白人组。在包含非英语测试者的样本中,模型拟合度与英语测试者样本相同。

讨论

本研究首次通过大规模样本验证了NACC UDS 2.0和3.0神经心理测验套件的四因子认知结构(情景记忆、注意、执行功能、语言),并证实其在不同的种族/族裔群体和UDS版本间具有部分标量等值性。这一发现为跨群体比较认知能力提供了理论依据和方法支持。

测量非等值性主要集中在语言和注意领域,其中蔬菜流畅性的非等值性最为显著。未校正这种非等值性会导致对某些群体认知能力的高估或低估,进而影响研究结果的准确性和临床评估的公正性。例如,在白人和黑人群体中,蔬菜流畅性得分低估了实际语言能力,而在亚裔群体中则轻微高估。这一现象可能与文化背景、语言习惯和教育差异有关。

UDS 2.0和3.0版本的对应测验具有等值的测量特性,表明它们可以互换使用,这为纵向研究和数据整合提供了便利。此外,本研究开发的部分标量等值模型可用于校正测量偏差,使得认知因子得分在不同群体间可直接比较。

研究的局限性包括未检验纵向测量等值性,以及未包含高阶认知因子模型。此外,尽管样本量大且多样化,但某些群体(如美洲原住民)的代表性不足。未来的研究应进一步探索测量非等值性的原因,并开发更精准的校正方法。

总之,本研究为使用NACC UDS数据进行的认知老化研究提供了重要的方法论支持。研究人员和临床医生在比较不同群体的认知得分时,应使用因子得分或仅比较等值的个体测验得分,以避免测量偏差带来的误差。这一工作对促进健康公平和提升老年生活质量具有重要意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号