编辑推荐:
为探究短串联重复序列(STRs)与阿尔茨海默病(AD)风险的关系,研究人员对 2981 名个体进行全基因组 STRs 分析。结果发现 AD 患者 STR 扩增负担更高,且扩增的 STRs 富集于大脑活跃启动子区域。该研究为 AD 遗传机制研究提供新视角。
阿尔茨海默病(Alzheimer’s disease,AD)是美国最常见的神经退行性疾病,在老龄化人口中的患病率不断上升,然而目前却缺乏有效的治疗方法。探究 AD 的遗传基础对于揭示其潜在基因和分子机制、推动更具针对性的治疗方法的开发至关重要。尽管已经对数以十万计的个体进行了研究,但 AD 的大部分遗传风险仍未被确定。此前,AD 遗传研究主要集中在单核苷酸变异和短插入 / 缺失上,而人类基因组中约一百万个短串联重复序列(short tandem repeats,STRs)与 AD 风险的关系却从未被探究过。STRs 是由 2 - 6 个碱基对(bp)的重复单元组成的 DNA 序列,其长度在人群中高度多态性,并且与广泛的基因表达变化相关,同时,STRs 的致病性扩增还会导致 30 多种神经系统疾病。因此,评估 STRs 是否也会增加 AD 风险显得尤为重要。
为了解决这一问题,来自美国宾夕法尼亚大学佩雷尔曼医学院(Perelman School of Medicine, University of Pennsylvania)等机构的研究人员开展了相关研究。他们利用阿尔茨海默病测序项目(Alzheimer’s Disease Sequencing Project,ADSP)中 2981 名个体(1489 名 AD 患者和 1492 名对照个体)的无 PCR 全基因组测序数据,对 312,731 个多态性 STR 区域进行基因分型。研究发现,AD 患者的 STR 扩增数量比健康老年对照者高 1.19 倍;携带超过 30 个 STR 扩增的个体患 AD 的几率比正常人高 3.69 倍,且神经病理学表现更严重;AD 相关的 STR 扩增在死后海马脑组织的活跃启动子区域以及 SINE - VNTR - Alu(SVA)反转录转座子中高度富集 。这表明基因组中活跃启动子区域的 STR 扩增与 AD 风险相关,为 AD 的遗传结构研究提供了重要见解。该研究成果发表在《Nature Communications》上。
研究人员在此次研究中主要运用了以下关键技术方法:首先,利用 ADSP 中 ADC 和 ROSMAP 队列的样本进行研究,限制分析对象为欧洲血统的白人个体,并对样本测序覆盖度进行筛选;其次,运用 gangSTR 和 ExpansionHunter 算法对 STR 进行基因分型,并通过与 PacBio 长读长测序数据对比评估分型准确性;最后,采用逻辑回归模型、超几何检验、DBSCAN 算法等进行关联分析和数据处理。
基因组范围内 STR 区域的分析
研究人员从 ADSP 的 WGS 数据集中选取了 2393 个样本(1213 名 AD 患者和 1180 名对照)作为发现队列,588 个样本(309 名 AD 患者和 279 名对照)作为复制队列。通过筛选,确定了 312,731 个多态性 STRs 进行全基因组评估。与长读长测序数据对比发现,ExpansionHunter 在检测 STR 扩增时更敏感,gangSTR 特异性更高。这些多态性 STRs 大多不在蛋白质编码区域,主要分布在内含子(47.4%)、远端非编码区域(36.7%)和启动子区域(14.1%) 。
单个 STR 与 AD 风险的关联测试
研究人员将 STR 长度视为连续变量进行逻辑回归分析,发现一个位于 chr19:44921097 - 44921125 的 TTTA 重复 STR 与 AD 临床诊断相关,但该 STR 与 APOE 基因连锁不平衡,并非独立的遗传关联。此外,虽然没有单个 STR 能主导 AD 遗传风险,但较长的 STR 长度似乎与较高的 AD 风险存在系统性关联。研究人员还设定不同的 STR 长度阈值进行分析,发现除了靠近 APOE 基因的 STR 外,其他 STR 在病例组和对照组之间的扩增数量差异在多重假设检验校正后均不显著。不过,AD 患者携带的较长且罕见的 STR 扩增数量明显更多。
确定 AD 中罕见 STR 扩增负担的增加
研究人员结合 ADC 和 ROSMAP 队列的样本,运用 DBSCAN 算法识别出 9641 个独特的 STR 扩增。AD 患者的 STR 扩增数量平均比对照多 1.19 倍,携带超过 30 个 STR 扩增的个体患 AD 的几率为 3.69 倍。同时,AD 患者的 STR 扩增长度比对照更长,且这些扩增在大脑活跃启动子区域和 SVA 元件中高度富集。此外,携带较多 STR 扩增的个体神经病理学表现更差,且 APOE 基因型与 STR 扩增负担无关。
STR 扩增在基因组活跃调控区域的富集
大部分 AD 相关的 STR 扩增不在蛋白质编码区域,而是在远端基因间区域(38.1%)或启动子区域(14.7%)。通过对染色质特征的分析发现,AD STR 扩增在反映活跃启动子区域的 “侧翼转录起始位点(TSS)” 和 “活跃 TSS” 染色质状态中高度富集,在 H3K4me3和 H3K27ac 等组蛋白标记的峰值区域也显著富集。同时,AD STR 扩增在 SVA 元件中高度富集,这表明这些区域的 STR 可能与 AD 发病机制相关。
AD STR 扩增在与 AD 相关疾病通路中的富集
研究人员对 AD STR 扩增附近的基因进行基因本体富集分析,发现许多相关基因集与神经元生物学过程相关,如 “神经元投射形态发生” 和 “轴突发育”。在基因体内的 AD STR 扩增分析中,发现其在与突触功能相关的基因集中显著富集,且 AD 患者基因体内的 STR 扩增负担更高,携带超过 10 个基因体内 STR 扩增的个体患 AD 的几率为 2.02 倍。以 GRID2 基因为例,该基因编码谷氨酸受体的一个亚基,在 AD 患者中其 STR 扩增数量明显多于对照个体。
研究表明,虽然没有单个 STR 能单独驱动 AD 的遗传风险,但基因组中多个 STR 扩增的多基因负担会增加 AD 风险。AD 相关的 STR 扩增在大脑活跃启动子区域和 SVA 元件中富集,可能在 AD 的发病和进展中发挥功能作用。然而,该研究也存在一定局限性,如仅使用外周血来源的 DNA,无法检测脑组织中 STR 的体细胞不稳定性;使用短读长 WGS 技术,STR 基因分型准确性有限;研究对象主要为欧洲血统个体,限制了研究结果的普遍性;研究为观察性研究,无法直接确定因果关系。尽管如此,该研究仍为 AD 遗传机制的研究开辟了新方向,未来需要进一步开展体外机制研究,以明确 STRs 与 AD 之间的因果关系,同时也需要运用更先进的技术和更大规模、更多样化的样本进行深入研究。