帕金森病前驱期DNA修复特征轨迹的纵向评估揭示早期生物标志物

《npj Parkinson's Disease》:Longitudinal assessment of DNA repair signature trajectory in prodromal versus established Parkinson’s disease

【字体: 时间:2025年12月06日 来源:npj Parkinson's Disease 6.7

编辑推荐:

  【编辑推荐】本研究针对帕金森病(PD)前驱期分子机制不清的难题,通过分析帕金森病进展标志物计划(PPMI)队列的纵向血液转录组数据,系统评估了DNA修复和整合应激反应(ISR)通路基因的表达动态。研究发现DNA修复(如ERCC6、NEIL2)和ISR基因表达能有效区分前驱期PD与健康对照(准确率最高达91%),而在确诊PD中区分度有限,提示这些通路在疾病早期具有更显著的生物学意义。约50%的DNA修复基因和74%的ISR基因呈现非线性表达轨迹,反映了前驱期短暂的代偿性应激反应。该研究为PD早期诊断提供了有前景的外周血生物标志物。

  
当詹姆斯·帕金森在1817年首次描述"震颤麻痹"时,他可能不会想到两个世纪后,这种疾病会成为全球增长最快的神经系统疾病。帕金森病(Parkinson's disease, PD)作为一种渐进性神经退行性疾病,其典型的运动症状——运动迟缓、震颤、肌肉强直和姿势不稳——通常在患者已经丧失大量多巴胺能神经元后才变得明显。而在这些运动症状出现前的数年甚至数十年,患者往往会经历一个被称为"前驱期"的阶段,表现为快速眼动睡眠行为障碍、嗅觉减退、便秘、抑郁和焦虑等非运动症状。
这种从前驱期到临床期的时间进程为研究者提供了一个关键窗口,使得在广泛的神经元丧失发生前识别疾病驱动的分子过程成为可能。在众多参与PD发病机制的机制中,基因组DNA损伤和修复功能障碍日益受到关注。越来越多的证据表明,DNA损伤在神经元中的积累可能在驱动疾病发生和进展中发挥积极作用。多巴胺能神经元代谢活跃,暴露于高水平的内源性活性氧(reactive oxygen species, ROS)——这是多巴胺代谢和线粒体呼吸的副产品。PD与线粒体电子传递和线粒体自噬受损有关,这进一步加剧了DNA损伤。随着时间的推移,这种慢性氧化性DNA损伤可能超过修复通路的容量,导致单链断裂(single-strand breaks, SSBs)和双链断裂(double-strand breaks, DSBs)的积累,以及多种碱基损伤。
细胞主要通过碱基切除修复(base excision repair, BER)通路来对抗氧化性DNA损伤,该通路在线粒体中尤为重要,因为它是线粒体中唯一完全功能的DNA修复机制。然而,矛盾的是,如果调控失常,BER本身可能成为应激源。最近在线虫PD模型中的研究表明,由DNA糖基化酶NTH-1启动的BER活性会导致修复中间体(单链断裂)的积累,从而在生理衰老过程中引发神经毒性。降低NTH-1水平实际上具有神经保护作用,能够预防神经退行性变。这突显了DNA修复通路虽然对细胞生存至关重要,但过度激活或处理有毒中间体(如SSBs和DSBs)缺乏协调性,可能通过耗尽资源或产生有毒DNA断裂末端而造成损害。
研究PD中DNA修复的一个主要挑战是受影响组织的不可及性,人们无法轻易监测活体患者相关细胞类型中的DNA损伤或修复活性。这激发了人们对可能反映中枢神经退行性过程的外周生物标志物的兴趣。因此,基于血液的转录组学在当前PD研究中备受关注。然而,先前的转录组学研究主要集中于区分PD患者与对照,而没有考虑到在PD患者中,高达80%的相关细胞类型已经发生了实质性细胞死亡。因此,这些基因表达模式在前驱期如何变化在很大程度上是未知的。
基于DNA损伤和修复缺陷早期参与PD的证据,一个合理的假设是,前驱期PD患者可能在临床表现出现前就在DNA修复通路中表现出独特的变化。在外周血中检测此类变化可能为正在进行的神经退行性过程提供非侵入性标志物。此外,比较前驱期与确诊期PD可以揭示是否存在修复机制的早期(可能是代偿性)上调,随后随着疾病进展而变得功能失调。
由丹麦·安瓦尔(Danish Anwer)、尼古拉·彼得罗·蒙塔尔(Nicola Pietro Montaldo)等研究人员发表在《npj Parkinson's Disease》上的这项研究,旨在通过利用来自健康个体、前驱期个体以及确诊PD患者的纵向转录组学数据,并应用机器学习,探索这些群体中DNA修复基因表达的动态调控,揭示精心策划的通路内的模式。
主要技术方法
本研究分析了来自帕金森病进展标志物计划(PPMI)队列的纵向血液转录组数据,包括健康对照、前驱期PD和确诊PD患者,在基线、12个月、24个月和36个月四个时间点的数据。研究聚焦于五个基因集:线粒体DNA修复(mtDNArep)、核DNA修复(DNArep)、整合应激反应(ISR)、PD核心基因(PD-core)和PD相关基因(PD-assoc)。采用差异表达分析(使用PyDESeq2)评估基线时组间基因表达差异。运用逻辑回归分类器进行机器学习分析,通过1000次自助法(bootstrap)验证,评估各基因集区分不同诊断组的能力,并计算分类准确度和受试者工作特征曲线下面积(AUC)。通过提取逻辑回归模型的系数进行特征重要性分析,识别对组间区分贡献最大的基因。同时考察了基因表达的纵向变异性和非线性轨迹。
差异表达分析
为了给基于基因集的分析定位,研究人员首先检查了基线时各诊断组间的全局差异表达模式。强烈差异表达基因的数量在不同比较中逐步增加:从健康与前驱期PD之间无显著变化,到前驱期与确诊PD之间以及健康与确诊PD之间存在广泛变化。尽管存在这些广泛变化,但来自mtDNArep、DNArep和ISR通路的基因在每次比较的前50个差异表达基因中基本缺席。只有一个基因,LITAF(ISR),出现在健康与确诊PD的比较中。
精心策划的通路基因在顶级差异表达基因中的相对缺失表明,这些通路在PD中的作用可能更为微妙,并且在疾病进展后期更相关,而不是由单个基因的初始大表达变化所标记。这些发现证实了需要进行纵向分析以检测协调的和潜在的渐进性表达变化。
基于DNA修复和ISR基因表达的健康与PD分期分类
研究人员评估了线粒体DNA修复、核DNA修复或ISR的基因表达模式是否能区分PD患者与健康对照。在所有时间点上,分类准确度在50%至64%之间(图2A,对应的AUC在图3A中),表明性能仅略高于随机概率。这些结果表明,这些通路的外周血表达未能提供一致或足够强的信号来可靠地区分确诊PD个体与健康个体。准确度随时间没有显示出一致的趋势,进一步支持了这样的结论:一旦疾病被临床诊断,这些转录谱保持相对稳定,并且不足以进行稳健的分类。
基于DNA修复和ISR基因表达的健康与前驱期PD分期分类
相比之下,当区分健康个体与PD前驱期个体时,对于所有三个基因集(DNArep、mtDNArep和ISR),分类准确度都很高,除了基线访视(图2B,对应的AUC在图3B中)。线粒体DNA修复基因集的准确度随时间稳步增加,在第36个月达到峰值0.89,而ISR基因集在第24个月准确度最高,达到0.91。基因表达变异性在基线时最大,并随时间减少,在第24个月观察到最低的方差。这种模式表明,随着疾病进展,基因表达水平在前驱期个体中变得更加一致。变异性的减少可能有助于提高分类准确度,并支持这样的观点:这些通路中的分子扰动在前驱期早期最具动态性,随着个体接近临床诊断而变得更加一致。
基于DNA修复和ISR基因表达的前驱期PD与确诊PD分类
类似地,在前驱期和确诊PD之间的分类准确度在大多数时间点持续较高,除了前驱期组的基线访视(图2C,对应的AUC在图3C中)。然而,准确度在后期时间点显示出轻微下降,表明这两个阶段之间的基因表达差异随着疾病向临床诊断进展而变得不那么明显。
PD相关和核心PD基因集
研究人员还评估了PD特异性基因集的性能,包括一组核心的公认PD相关基因(PD core)和一组更广泛的PD相关基因(PD assoc),以比较它们与DNA修复和ISR通路相比的分类能力。该分析旨在确定与PD直接相关的基因是否显示出比更一般的应激和修复通路更清晰的转录差异。
基于PD相关和核心PD基因集的健康与PD分类
在这个外周血数据集中,无论是PD核心还是PD相关基因集都不能可靠地区分健康个体与确诊PD个体(图2D,对应的AUC在图3D中)。分类准确度在所有时间点都保持低位,范围在49%至65%之间,表明一旦PD临床确诊,这些通路中的转录差异有限。
基于PD相关和核心PD基因集的健康与前驱期PD分类
相比之下,PD核心和PD相关基因集在区分健康个体与前驱期个体时表现良好,支持了研究方法的有效性(图2E,对应的AUC在中间时间点)。PD assoc基因集总体表现出稍强的性能。然而,与其他基因集一样,准确度在前驱期基线较低,并在后期访视中显示出轻微下降。
基于PD相关和核心PD基因集的前驱期与确诊PD分类
PD核心和PD相关基因集在区分前驱期与确诊PD时也达到了高准确度,与DNA修复和ISR通路的结果一致(图2F,对应的AUC在图3F中)。分类准确度在前驱期组的第24个月达到峰值,而基线再次显示出较弱的组间分离。
全局基因表达分类:健康与PD之间缺乏区分度
为了确定是否有任何基因或基因组合在任何时间点能够稳健地区分健康个体与确诊PD,研究人员还对整个数据集进行了分类分析。值得注意的是,分类准确度在各个时间点都保持低位(53-67%),表明外周血RNA测序未能为确诊PD提供可靠的生物标志物。
纵向基因表达
研究人员检查了基因表达在每个诊断组内随时间的变化。在健康个体和确诊PD个体中,基因表达在所有时间点保持相对稳定,仅观察到微小变化。相比之下,处于前驱期的个体表现出更大的变异性。许多基因在基线时具有最高的表达变异性,并在第24个月变得更加一致。这种早期的变异性可能导致基线时分类准确度较低,以及在后期时间点观察到的准确度提高。
值得注意的是,前驱期组中的许多基因并不遵循简单的上升或下降趋势。相反,它们随时间显示出动态的、非线性的模式。大约一半的DNA修复基因和近四分之三的ISR基因显示出非线性轨迹,其中表达先上升后下降,或反之,或混合模式。这些结果表明,前驱期以对早期疾病过程的活跃但暂时的转录反应为标志。随着疾病进展,这种反应似乎下降或崩溃,导致在确诊PD中看到的更稳定但区分度较低的基因表达模式。
特征重要性
为了更好地理解分类结果,研究人员通过分析第12、24和36个月的特征重要性得分,确定了哪些基因对组间分离贡献最大。由于分类准确度低,基线值被排除在外。表1详细列出了三个基因集在每个时间点的前5个基因。
mtDNA_rep
Healthy vs. Prodromal
Prodromal vs.PD
M12
M24
M36
M12
M24
M36
NEIL2
DNA2
POLB
NEIL2
DNA2
PRIMPOL
LIG3
POLQ
PRIMPOL
NTHL1
NEIL2
RAD23A
NTHL1
NEIL2
PNKP
LIG3
NTHL1
BRCA1
CRY1
NTHL1
ERCC6
MPG
ERCC6
NEIL2
ERCC6
OGG1
PARK7
ERCC6
CRY1
DNA2
nDNA_rep
Healthy vs. Prodromal
Prodromal vs.PD
M12
M24
M36
M12
M24
M36
POLE3
ERCC6
POLB
POLD4
POLE3
SMUG1
XPA
MAD2L2
RBX1
POLE3
MAD2L2
POLD4
H2AX
POLD4
POLD4
XPA
MMS19
POLL
POLD4
POLE
POLI
H2AX
APEX1
POLB
MAD2L2
PRKDC
PRKDC
APEX1
MBD4
POLE3
ISR
Healthy vs. Prodroma vs.PD
M12
M24
M36
M12
M24
M36
CEBPB
NFE2L2
KAT2B
NFE2L2
ATF6
KDM6B
NFE2L2
PTGS2
KDM6B
PTGS2
IARS1
KAT2B
CARS2
ATF6
CEBPB
POLR2C
PSEN1
NFE2L2
CARS1
KDM6B
CDC42
NARS1
BBC3
SQSTM1
ATF2
CEBPB
S100P
IRF7
CEBPA
CXCL8
mtDNA_rep基因集的特征重要性分析
在mtDNA_rep基因集中,分类健康与前驱期PD时,基因ERCC6和PRIMPOL在所有三个时间点持续排名前10。NEIL2、NTHL1、RAD23A和DNA2在M12和M24排名前10,而MUTYH在M24和M36排名前10。
在分类前驱期与确诊PD时,NEIL2和ERCC6在所有三个时间点持续排名前10。ERCC2和NTHL1在M12和M24排名前10。值得注意的是,NTHL1在M36降至第26位。DNA2在M24和M36排名前10。
DNA_rep基因集的特征重要性分析
在DNA_rep基因集中,分类健康与前驱期PD时,基因POLD4、XPC、POLE3和MAD2L2在所有三个时间点持续排名前20。H2AX、ERCC6、NEIL2、APEX1、GTF2H1和APTX在M12和M24排名前20,而POLB、PRKDC、REV3L和POLE4在M24和M36排名前20。
在分类前驱期与确诊PD时,POLD4、POLE4和ERCC6在所有三个时间点持续排名前20。RIF1、MAD2L2、REV1、APEX1、POLA1、H2AX和MMS19排名靠前。值得注意的是,APEX1、POLA1、H2AX和MMS19在M36排名大幅下降。RAD23B、MBD4、PRKDC和REV3L在M24和M36均排名前20。
ISR基因集的特征重要性分析
在ISR基因集中,分类健康与前驱期PD时,基因KDM6B、CEBPB、CDC42、S100P、HLA-DRB1、LITAF、CARS2、ATF2、IRF7、PSEN1、ERVW-1、ATF4、NFE2L2、SLC38A2、CREBBP、LARS1、CXCL8、IARS1和ATF6在所有三个时间点持续排名前20。PTGS2、CARS1、CREB1和RPS6KA3在M12和M24排名前20,而IARS1在M24和M36排名前20。
在分类前驱期与确诊PD时,NFE2L2、CXCL8、CEBPB、ATF6和IARS1在所有三个时间点持续排名前20。POLR2C、CARS1、BBC3和CSF1R在M12和M24排名前20,而KDM6B、STAT3、RPS6KA3、DISC1和GRIN2A在M24和M36排名前20。
研究结论与意义
这项研究利用外周血转录组学调查了PD前驱期DNA修复和ISR基因表达的纵向变化。研究结果对DNA修复表达失调在PD症状表现前很久就已发生的观点增加了新的细微差别。这与先前在PD患者中DNA损伤和基因组维持机制受损的横断面证据密切一致。纵向分析提供了整个PD前驱期DNA修复和ISR基因表达的新动态特征。利用外周血转录组数据的严格分类分析,研究发现与DNA修复和ISR相关的基因集能有效区分前驱期PD个体与健康对照和确诊PD。相反,这些基因表达特征不能可靠地区分临床确诊的PD患者与健康个体,强调了DNA修复和ISR最显著的外周信号发生在疾病进展的早期,远在典型运动症状出现之前。
数据进一步突显了前驱期PD中存在显著的转录变异性,以及重要的是,许多基因中的非线性表达模式。大约一半的DNA修复通路基因和近四分之三的ISR相关基因表现出这种非线性表达轨迹。这些复杂的时间模式可能反映了一种旨在减轻累积基因组应激的初始适应性反应,随后随着代偿机制在疾病进展中变得不足而最终下降。
精心策划的DNA修复和ISR基因在顶级差异表达基因中的相对缺失表明,这些通路可能不是由单个基因表达的大变化驱动,而是反映了跨多个组分的微妙、协调的转变。这突显了单基因差异表达分析在捕捉早期疾病特征方面的局限性,并强化了通路水平和整合建模方法的合理性。
特征重要性分析通过一致地将特定的DNA修复基因,最重要的是ERCC6、PRIMPOL、NEIL2和NTHL1,确定为前驱期PD的显著且反复出现的分子预测因子,进一步强化了研究结果。ERCC6和NEIL2在多次评估中持续排名靠前,提示其作为早期生物标志物的潜在作用。有趣的是,NTHL1作为一个强的早期重要特征出现,但在后期重要性下降,提示其在初始前驱期的重要作用,这可能反映了随着疾病进展最终被压倒的代偿性修复机制。
ERCC6,也称为CSB,对转录耦合核苷酸切除修复(transcription-coupled nucleotide excision repair, TC-NER)至关重要。它促进修复酶的接入,并与TP53和RNA聚合酶II等关键因子相互作用。ERCC6功能障碍导致氧化性DNA修复缺陷,有助于神经细胞死亡、光敏感和早衰。NEIL2是一种参与BER的DNA糖基化酶,在维持核和线粒体基因组完整性方面起着关键作用。NEIL2与RNA聚合酶和相关蛋白结合,提示其参与转录耦合修复。在神经退行性疾病中积累的铁和铜会抑制NEIL2活性,可能加剧氧化性DNA损伤。PrimPol是一种新发现的引物酶-聚合酶,在核和线粒体DNA维护中起着关键作用。它作为DNA聚合酶,能够延伸引物并绕过各种损伤,并作为引物酶催化DNA引物形成,对于核和线粒体中有效的DNA复制至关重要。
collectively,这些发现表明,DNA修复功能障碍和ISR通路中的动态变化发生在PD发病机制的早期,并且可以在外周血中可靠地
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号