多祖先多基因风险评分疾病预测模型的优化及其临床应用潜力

【字体: 时间:2025年05月21日 来源:Scientific Reports 3.8

编辑推荐:

  为解决多基因风险评分(PRS)模型在临床应用中准确性、可解释性及跨人群适用性的问题,研究人员基于跨祖先全基因组关联研究(GWAS)开展 30 种疾病的 PRS 模型优化。通过整合多算法构建集成模型并纳入临床特征,结果显示 12 种模型 AUC 超 80%,证实其临床应用潜力。

  
在遗传流行病学领域,多基因风险评分(Polygenic Risk Scores, PRS)的出现为疾病预测带来了新希望。它通过整合众多对疾病影响较小的遗传变异,能够评估个体对复杂疾病的遗传易感性,在心血管疾病、精神疾病和癌症等多种疾病的风险预测中展现出潜力,甚至有望为个性化医疗提供依据,实现基于个体遗传风险的干预措施。然而,当前 PRS 模型在临床应用中面临诸多挑战:一方面,大多数全基因组关联研究(Genome-Wide Association Studies, GWAS)基于欧洲人群,导致模型在非欧洲人群中预测效力下降;另一方面,模型需要提升准确性、可解释性,并实现与环境、生活方式因素的整合,以满足临床诊断测试的标准。

为突破这些瓶颈,美国 Omics Edge 公司的研究人员开展了相关研究。他们聚焦于优化多祖先 PRS 模型,旨在开发具有临床实用性的疾病预测工具。研究成果发表在《Scientific Reports》,为 PRS 的临床转化提供了重要参考。

研究采用了以下关键技术方法:首先,利用跨祖先 GWAS 荟萃分析,整合 UK Biobank、FinnGen、BioBank Japan 等多队列数据,生成 30 种医学相关性状的全基因组汇总统计数据;其次,在 UK Biobank 队列中对 6 种 PRS 算法(如 SBayesRC、LDpred2、PRS-CS 等)进行基准测试,筛选高性能算法;然后,通过逻辑回归构建集成模型(Ensemble Model),结合 top-performing 算法输出,并纳入年龄、性别、祖先成分(如主成分分析 PCs、局部祖先推断 Orchestra)和临床风险因素(如肥胖、高血压),构建疾病预测模型;最后,在 eMERGE 和 PAGE MEC 等多样化队列中验证模型性能,并与 Thompson 等和 Lennon 等的前沿模型进行对比。

跨祖先 GWAS 荟萃分析与 PRS 算法基准测试


通过跨祖先 GWAS 荟萃分析,研究生成了 30 种性状的新汇总统计数据,相比单一 UK Biobank 数据,二元性状病例数增加 6.4 倍,定量性状样本量增加 7 倍,显著提升了统计效力。在 6 种 PRS 算法中,SBayesRC 在 21 种性状中表现最佳,尤其在心血管和代谢性疾病中优势显著;SCT(Stacked C+T)在心血管性状(如冠心病、心房颤动)中表现优异;LDpred2 和 lassosum2 则在神经精神和胃肠道疾病(如阿尔茨海默病、克罗恩病)中更具优势。各算法间的低相关性(如 SCT 与其他算法)为集成模型的构建提供了基础。

集成 PRS 模型的性能提升与跨队列验证


集成模型通过逻辑回归整合 SBayesRC、SCT、LDpred2 等算法输出,在 UK Biobank 测试队列中,23 种性状的 AUC 显著高于单一最佳算法(如 SBayesRC),且相比 Thompson 等的模型,26 种性状的 AUC 提升显著(中位提升 5.07%)。在 eMERGE 和 PAGE MEC 队列中,集成模型同样优于 Lennon 等的模型,且在非欧洲人群(如非洲、亚洲)中表现出较好的稳定性,性能下降幅度小于 4%。这表明集成模型通过融合多算法优势,有效提升了预测准确性和跨人群泛化能力。

纳入临床特征的疾病预测模型优化


在集成 PRS 模型基础上纳入祖先成分(PCs 和 Orchestra 局部祖先推断)、年龄、性别和临床风险因素后,模型性能进一步提升。其中,年龄和性别对模型的贡献显著,如阿尔茨海默病模型中年龄权重达 74%,系统性红斑狼疮中性别权重达 37%。12 种模型的 AUC 超过 80%,25 种性状的诊断比值比(Diagnostic Odds Ratio, DOR)超过 5,19 种超过 10,显示出高预测价值。例如,冠心病模型中,PRS 联合临床特征的高风险组识别出的真实病例数是罕见致病突变模型的 55-80 倍,凸显了多基因风险评估的临床优势。

PRS 与罕见变异的风险对比及临床转化意义


研究对比了 PRS 与罕见致病变异(如 BRCA1/2、LDLR 突变)的风险预测能力,发现 PRS 虽对早发性疾病贡献较小,但能捕获更多晚发性病例,且多基因背景可调节罕见变异的效应。例如,在冠心病中,高 PRS 组可使罕见突变携带者的风险比(Odds Ratio, OR)从 1.22 提升至 7.05,表明两者在风险评估中具有互补性。此外,多数模型的 DOR 显示出作为诊断测试的潜力,为临床决策提供了量化依据。

研究通过跨祖先数据整合、多算法集成和临床特征融合,开发了具有高准确性和跨人群适用性的 PRS 疾病预测模型,证明其在临床场景中作为辅助诊断工具的可行性。尽管非欧洲人群的性能仍有提升空间,但该研究为 PRS 的临床转化奠定了基础,推动其向个性化风险分层、早期筛查和治疗干预的实际应用迈进。未来,随着 GWAS 样本多样性的增加和算法优化,PRS 有望成为精准医学的核心工具之一。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号