阿尔茨海默病研究中心队列演变与异质性:NACC UDS二十年数据揭示的泛化性挑战与机遇

【字体: 时间:2025年09月20日 来源:Alzheimer's & Dementia 11.1

编辑推荐:

  本文系统分析美国国家阿尔茨海默病协调中心(NACC)统一数据集(UDS)二十年招募趋势,揭示各研究中心在人口特征、临床诊断和招募方式上的显著异质性,为观察性研究泛化性(generalizability)提供创新方法论视角。

  

1 背景

自2005年以来,美国国家阿尔茨海默病协调中心(NACC)通过统一数据集(UDS)收集来自阿尔茨海默病研究中心(ADRCs)的纵向临床测量和诊断数据。尽管早期招募和UDS第3版启动时已报告过人口统计学摘要,但对时间模式和中心间异质性的全面评估仍然有限。

NACC UDS数据虽被广泛用于研究,但其研究结果的外部有效性始终存在疑虑。普遍观点认为,研究结果的泛化性取决于研究人群的代表性和招募策略的无偏性。由于各ADRC通过临床医生推荐和社区招募等混合方式招募参与者,NACC UDS数据最好被视为志愿者样本,没有特定的抽样框架,不能代表更广泛的美国老年人群。最近一项研究量化了NACC UDS与具有全国代表性的健康与退休研究(HRS)在许多参与者特征上的差异。

各ADRC的招募方法各异,反映了不同的研究重点。最近一项研究使用初始UDS访视时认知正常参与者的比例作为ADRC尸检研究中招募偏倚的代理指标,证明这一代理指标可以解释非AD病理学中看到的差异,并强调了在分析中考虑基于招募的异质性的重要性。

美国老龄化人口不断变化的 demographics 进一步使泛化性复杂化。到2030年,五分之一的美国人年龄将达到65岁或以上。老年人口的种族和民族构成正变得更加多样化,历史上痴呆症患病率较高但在研究中代表性不足的种族背景预计将大幅增加。教育程度作为认知衰退的关键保护因素,在不同出生队列中发生了显著变化。

了解招募特征如何随时间演变以及各中心间的差异,对于评估从NACC UDS数据得出的研究结果对更广泛或特定人群的适用性至关重要。本文旨在通过描述二十年招募变化并量化基线特征的中心间异质性来弥补这一知识缺口,同时概述增强泛化性的方法策略和未来方向。

2 方法

本研究使用NACC UDS数据。分析样本提取自2024年9月的数据冻结,包含2005年至2024年间招募的参与者。由于UDS包含过去和现在ADRC的数据,并且新的ADRC随着时间的推移不断获得资助,我们将分析限制在至少具有3年参与者招募的中心,以提高研究结果的稳定性。我们关注在初始UDS访视期间获得的参与者特征。

研究的特征包括年龄、性别、种族、教育程度、临床诊断、转诊来源、家族史和共同参与者关系。基线访视时的年龄分为60岁以下、60-69岁、70-79岁和80岁或以上。使用自我报告的种族,分为三个类别:白人、非洲裔美国人和其他(包括印第安原住民、夏威夷原住民、亚洲人和多种族参与者)。我们将多个种族类别合并为其他,因为每个类别在招募年份或中心中的细胞数都非常少。教育程度分为12年或以下、13-16年、17-18年和19年或以上,大致对应高中、学士学位、硕士学位和博士学位。临床诊断有四个类别:认知正常、受损非轻度认知障碍(MCI)、MCI和痴呆。转诊类型的定义在UDS第3版中发生了变化,我们根据NACC衍生变量NACCREFR考虑了提供者转诊的二元变量,该变量包括由ADRC或其他研究临床医生、工作人员、研究者以及护士、医生或其他医疗保健提供者的转诊(UDS 1.2和2.0版),以及临床医生和诊所样本(UDS 3.0版)。NACC UDS数据不包含更详细的转诊来源版本。尽管记录转诊来源的方式随着UDS 3.0版的引入而改变,但并未在其实施过程中提议对招募实践进行系统性或中心范围的改变。我们使用至少一名一级家庭成员有认知障碍的指标来评估家族史。共同参与者与参与者的关系分为配偶、子女和其他。

我们使用多项Cochran-Armitage趋势检验来评估招募特征随时间的变化,并使用同质性卡方检验评估基线特征的中心间差异。使用5%的名义显著性水平。使用R 4.4.3版进行统计分析。

3 结果

分析共包括42个过去和现在的ADRC,在2005年至2024年间共招募了51,984名参与者。在这些ADRC中,10个中心的招募时间为9年或更短,9个中心的招募时间为10-19年,23个中心的招募时间为20年(自UDS数据开始以来)。每个中心招募的参与者人数从96人到3249人不等,中位数为1188人。

图表显示了年龄、性别、种族、教育程度、临床诊断、转诊来源、家族史和共同参与者关系随时间和跨中心的分布。在UDS历史的早期,招募主要关注老年人。最近的招募包括了更广泛的年龄分布,基线年龄在70岁以下的参与者数量增加。趋势检验拒绝了年龄分布随时间无方向性变化的零假设(p < 0.001)。基线访视时年龄在70岁以下的参与者比例在各中心间从19%到78%不等,中位数为41%。各中心间的年龄分布存在统计学显著差异(p < 0.001)。

总体而言,男性参与者占总参与者的43%,未检测到显著的时间趋势(p = 0.14)。然而,男性参与者的比例在各中心间差异显著(p < 0.001),范围从23%到53%。

种族构成发生了 modest 但可测量的变化。虽然大多数ADRC主要招募白人参与者并且持续如此,但非洲裔美国人和其他种族/ethnic 少数群体的比例随时间增加(p < 0.001)。除两个中心外,白人参与者的比例在65%到95%之间。另外两个中心的白人参与者比例显著较低(分别为12%和42%)。白人参与者的比例在各中心间差异显著(p < 0.001)。

高中或以下教育程度的参与者比例随时间下降。趋势检验拒绝了教育程度随时间无方向性变化的零假设(p < 0.001)。一些中心主要从高教育程度人群中招募,而其他中心则具有更广泛的教育代表性。高中或以下教育程度的比例从6%到42%不等,并且在各中心间差异显著(p < 0.001)。

随着时间的推移,新参与者在入组时更可能是认知正常的(p < 0.001),但基线临床诊断的分布在各中心间存在显著差异(p < 0.001)。基线时认知正常的比例从18%到76%不等。一些中心招募的参与者中超过一半基线诊断为MCI。

医疗保健提供者转诊在随时间的新招募中占据了更大份额(p < 0.001),尽管增长似乎在2021年达到顶峰。根据转诊类型,各中心间存在显著的异质性(p < 0.001),各中心的提供者转诊比例从低至20%到高达90%不等。

总体而言,58%的参与者至少有一名一级亲属有认知障碍,未检测到显著的时间趋势(p = 0.21)。该比例在各中心间差异很大(p < 0.001),范围从48%到80%。

趋势分析表明,随着时间的推移,共同参与者与新招募参与者的关系发生了变化(p < 0.001)。子女作为共同参与者的比例下降,而配偶和其他共同参与者的比例随时间波动。共同参与者关系在各中心间也存在显著异质性,配偶作为共同参与者的比例从29%到79%不等。

4 讨论

观察到的招募特征随时间的变化可能反映了ADRCs不断演变的研究重点。早期的招募重点与在症状性老年人中表征AD临床表型的早期目标一致。基线年龄和初始临床诊断分布的变化可能反映了对AD早期检测、预防和临床前阶段的扩展兴趣。非白人参与者比例的增加反映了更广泛的公众外展和参与。

NACC队列是一项大型多中心工作,数据收集需要在多个目标之间取得平衡,并允许解决各种科学问题。各ADRC之间缺乏统一的招募标准,创建了一个 population samples 的拼凑物,这使得出泛化性结论的努力复杂化。为了支持广泛的科学问题,各ADRC的招募策略有意针对具有不同人口统计学和临床特征的异质亚人群。因此, resulting samples 并不代表当地地区或美国人口,这限制了传统统计意义上的泛化性。然而,这些样本中嵌入的多样性拓宽了相关性和泛化性见解的范围。未来的努力需要更好地记录中心特定的招募过程随时间的变化,以了解NACC队列的演变。

代表性(representativeness)是泛化性的充分但非必要条件,尽管历史上它被视为两者都是。代表性允许准确捕捉人口特征 snapshot,这些特征可能会也可能不会被 transport 到不同人群或不同时间。最近的文献强调使用加权或协变量调整将 findings 从非代表性样本 transport 到目标人群,但这些方法通常依赖于强假设,例如重叠和 common covariates 的可用性,以捕捉所有选择偏倚。这些假设在NACC UDS数据与行为风险因素监测系统(BRFSS)或HRS等代表性调查之间可能不成立。此外,当前的 transportability 方法通常不考虑源和目标人群随时间的变化。

另一方面,泛化性通常针对暴露-结果关联,即因果性的(例如,由于假设的生物学机制)并且在人群间和跨时间不变,并且通常不需要代表性来进行一致估计。即使预期存在异质性暴露效应,仍然不需要对一般人群的代表性,甚至可能适得其反。例如,效应更明显的亚人群在样本中的代表性可能有限,无法实现代表性,同时可能导致统计效率的潜在损失。通常,暴露的充分变异比人群水平的代表性更重要,因此研究通常有意针对感兴趣的代表性不足的暴露群体。

像NACC数据这样的观察性研究受到选择偏倚的影响,选择偏倚可以广义地定义为目标人群中感兴趣的参数与从可用数据估计的参数不同的任何情况。偏倚的大小和方向取决于具体的科学问题和实际的招募机制。例如,假设我们旨在估计一般老年人群中抑郁与AD之间的关联。如果同时患有AD和抑郁的个体与没有抑郁的AD病例相比,更可能或更不可能被招募,则可能出现选择偏倚。在专注于神经精神病学的记忆诊所中,患有抑郁的AD病例可能被选择性转诊和招募,导致 over-representation 并夸大关联。相反,在社区样本中,同时患有AD和抑郁的个体可能更不容易被招募,关联可能被 attenuate。通常,由于样本选择,有多种情况可能发生,例如当招募依赖于因果路径中暴露的上游因素、暴露和结果之间的因素,或两者下游的因素时。然而,对各种形式的选择偏倚的认识有限,并且除了选择是由于观察到的混杂因素且没有由于未测量因素导致的效应异质性的情况外,可用的分析方法很少。在这种情况下,基于观察到的协变量进行加权或回归调整理论上可以消除偏倚,但所需强假设通常被认为在实践中不可能成立。另一方面,一个 well-powered 研究的结论可能会被弱的、未测量的混杂因素推翻。由于NACC样本量大,即使效应量很小,它通常也有 high power 来拒绝某些零假设。可以进行敏感性分析来量化未测量混杂因素的最小强度,以消除观察到的微小但显著的效应,并且是量化观察性研究中证据强度的有用工具。

可以通过层次模型或 meta-analysis 框架来检查中心水平的效应异质性,将每个中心视为一项研究。这种方法是可行的,因为ADRC的数量很多,并且许多中心拥有大样本量和长的随访期。忽略中心水平的效应异质性通常会导致低估标准误,并可能由于 inflated Type I error 而错误地拒绝零假设。此外,各中心的纳入或排除标准不同,有时甚至由于加入附属研究而在中心内也不同。然而,缺乏对这些差异的透明记录。这个问题类似于临床试验中常见的情况,其中 meta-analytic 方法被常规应用。在估计中考虑效应异质性可能有助于识别值得进一步调查的特定中心或省略的效应修饰因子。此外,由于招募策略是分散的,选择偏倚的机制和后果可能因中心而异。在这种情况下,可以对中心特定估计进行敏感性分析的 meta-analytic 技术,这可能比从单一观察性研究设计得出的结论更稳健,因为单一设计可能受到特定但通常未知形式的选择偏倚的影响。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号