
-
生物通官微
陪你抓住生命科技
跳动的脉搏
跨祖先多样性视角下的帕金森病多基因风险评分比较研究:打破"一刀切"预测模式的局限性
【字体: 大 中 小 】 时间:2025年07月04日 来源:npj Parkinson's Disease 6.7
编辑推荐:
本研究针对帕金森病(PD)多基因风险评分(PRS)在多样化人群中的适用性瓶颈,通过构建105种PRS模型,系统评估了欧洲中心模型与多祖先荟萃分析模型在7种遗传背景人群中的预测效能。研究发现SNCA(rs356182)等关键变异存在显著祖先异质性,非洲人群AUC低至0.54而德系犹太人达0.66,证实当前PRS模型存在人群偏倚,为开发包容性风险预测工具奠定基础。
帕金森病作为全球增长最快的神经退行性疾病,其遗传风险评估长期受困于"欧洲中心主义"的局限。尽管全基因组关联研究(GWAS)已鉴定90个欧洲人群风险变异,但这些标记在非洲、东亚等群体中的预测效能如同"盲人摸象"——不同祖先人群的连锁不平衡模式、等位基因频率乃至效应方向都可能存在显著差异。这种遗传架构的多样性导致基于单一祖先开发的PRS模型在跨群体应用时,预测准确性可能从德系犹太人群的0.66 AUC骤降至非洲人群的0.54,这种"水土不服"现象严重阻碍了精准医学的公平实现。
为破解这一难题,由美国国立卫生研究院(NIH)衰老研究所Sara Bandres-Ciga领衔的国际团队,在《npj Parkinson's Disease》发表了迄今最全面的跨祖先PRS比较研究。研究人员整合全球帕金森病遗传计划(GP2)中45,799例多祖先样本(涵盖非洲、德系犹太人、拉丁美洲等7类群体),创新性地平行评估两种建模策略:Model 1采用欧洲发现的90个风险变异,分别加载欧洲、东亚等四种祖先的效应值;Model 2则基于多祖先GWAS荟萃分析数据,采用p值阈值法优化SNP组合。通过系统比较56种Model 1与49种Model 2变体,绘制出PRS预测效能的全球差异图谱。
关键技术方面,研究团队采用NeuroBooster基因分型芯片获取1,914,935个位点数据,经TOPMed平台进行全基因组插补。利用PRSice-2软件实施p值阈值优化(5×10-8至5×10-2),并通过Neural ADMIXTURE算法精确量化个体祖先成分。所有分析均调整性别、年龄及10个主成分,采用DeLong检验比较模型间AUC差异。
【风险变异呈现祖先特异性分布】
通过Upset plot可视化分析发现,欧洲人群87个有效预测因子在东亚仅56个可检测。关键基因呈现"东西差异":SNCA(rs356182)在东亚效应值翻倍但未见于东亚荟萃统计,而LRRK2 G2019S(rs34637584)仅在欧洲/德系犹太人中显著。有趣的是,GBA1 N370S在德系犹太人群贡献突出,印证了该群体特有的遗传负荷。
【欧洲模型跨群体适用性有限】
Model 1在欧洲人群表现最佳(AUC=0.63),德系犹太人因共享遗传背景达0.66 AUC。但非洲群体预测效能最弱(AUC=0.54),而非洲混血群体因欧洲血统占比高获得意外0.65 AUC。引人深思的是,采用东亚特异性11个变异构建的简化模型,其性能(AUC=0.60)竟优于加载87个欧洲变异的模型。
【多祖先模型展现优化潜力】
Model 2在非洲群体表现突出(最优p=5×10-7),显著优于欧洲模型(p<0.05)。非洲人群因短单倍型需纳入506个SNP,远超欧洲的267个。但该模型在东亚等群体仍存局限,反映当前多祖先GWAS中欧洲样本占比83%的结构性偏差。
这项研究犹如一面镜子,映照出神经遗传学研究中的"多样性赤字"。其核心启示在于:首先,SNCA等"明星基因"的预测价值存在明显地理梯度,单纯增加SNP数量不如精选群体特异性标记;其次,非洲人群需要更宽松的p值阈值来捕获分散的遗传信号,这与其悠久的群体历史吻合;最后,临床数据(如嗅觉功能)的缺失制约了模型优化,暗示多组学整合将是突破方向。
正如作者强调,该研究为开发"全球适用"的PRS提供了方法论框架。未来需要扩大非欧洲人群GWAS样本量,并探索局部祖先分析等新算法。随着GP2等国际计划持续推进,这项工作或将成为打破遗传风险评估"欧洲中心"格局的重要里程碑,最终实现帕金森病精准预防的"一个都不能少"。
生物通微信公众号
知名企业招聘