多基因风险分类的不稳定性及整合评分的缓解作用:为精准健康管理带来新曙光

【字体: 时间:2025年02月13日 来源:Nature Communications 14.7

编辑推荐:

  在多基因风险评分(PRS)临床应用日益广泛之际,其高风险分类却存在不稳定问题。研究人员利用 All of Us 队列开展研究,发现整合评分(ChronoAdd<sub>(Pub<sub>n</sub>)</sub>)可提升高风险分类的一致性和预测能力,对临床精准风险评估意义重大。

  在现代医学领域,基因检测技术的飞速发展为疾病预测和预防带来了新的希望。多基因风险评分(Polygenic Risk Scores,PRS)作为一种新兴的工具,能够量化个体从常见基因变异中继承的疾病风险,在过去十年里其预测性能不断提升。随着全基因组关联研究(Genome-Wide Association Studies,GWAS)规模的不断扩大,以及各种先进分析方法的涌现,PRS 在预测复杂疾病风险方面展现出了巨大潜力。第三方基因检测公司和医疗机构纷纷将 PRS 应用于临床实践,为患者提供诸如冠心病、糖尿病、癌症等疾病的风险评估报告。然而,在这看似一片光明的发展前景背后,却隐藏着一个不容忽视的问题 —— 高基因风险分类的不稳定性。
不同研究和公司使用不同的 PRS 对同一疾病进行风险评估时,常常出现对高风险个体的分类差异巨大的情况。例如,在评估心血管疾病风险时,不同的风险预测模型由于训练人群、结果定义和统计方法的不同,可能导致对同一患者的风险分类截然不同。这种不稳定性不仅给临床决策带来了困惑,也让患者对预测结果的可靠性产生怀疑。此外,随着 GWAS 和 PRS 方法的不断进步,新的 PRS 不断涌现,如何在不引起混乱的情况下更新分数或纳入新数据,成为了亟待解决的问题。

为了解决这些问题,来自麻省理工学院和哈佛大学 Broad 研究所、马萨诸塞州总医院等机构的研究人员开展了一项重要研究。他们利用规模庞大且具有多种族背景的 All of Us(AOU)队列,对已发表的冠心病(Coronary Artery Disease,CAD)、2 型糖尿病(Type 2 Diabetes Mellitus,T2DM)和重度抑郁症(Major Depressive Disorder,MDD)的多基因评分进行了全面评估。

研究人员首先从 Polygenic Score Catalog 下载了相关的 PRS 数据,并在 AOU 队列中计算了 57 个 CAD 评分、129 个 T2DM 评分和 18 个 MDD 评分。他们按发表时间顺序对这些评分进行排序,并确定每个发表中的最佳 PRS(Best<sub>(Pub<sub>n</sub>)</sub>),即与目标疾病关联最强的评分。研究发现,虽然每个 Best<sub>(Pub<sub>n</sub>)</sub>在人群水平上的关联强度较为一致,但在个体层面,将个体分类到每个 PRS 分布前 10%(定义为高遗传风险)的情况却差异巨大。以 Jaccard 指数衡量,CAD 的 Best<sub>(Pub<sub>n</sub>)</sub>评分之间的中位 Jaccard 指数仅为 0.17 [0.13 - 0.22],T2DM 为 0.18 [0.15 - 0.22],MDD 为 0.11 [0.08 - 0.17],这表明不同评分之间对高风险个体的分类一致性很差。

随后,研究人员采用一种整合评分的方法,利用 PRS 混合(PRSmix)框架创建了整合多基因评分 ChronoAdd<sub>(Pub<sub>n</sub>)</sub>。该框架通过弹性网方法将多个 PRS 的信息整合在一起,生成一个新的评分,从而提高预测准确性。研究人员为每个发表生成了相应的 ChronoAdd<sub>(Pub<sub>n</sub>)</sub>评分,即将该发表中的所有评分与之前发表的所有评分进行整合。结果显示,与 Best<sub>(Pub<sub>n</sub>)</sub>相比,ChronoAdd<sub>(Pub<sub>n</sub>)</sub>评分在高风险分类上表现出更高的一致性。例如,CAD 的 ChronoAdd<sub>(Pub<sub>n</sub>)</sub>评分的中位 Jaccard 指数提高到了 0.39 [0.25 - 0.51],T2DM 为 0.64 [0.45 - 0.83],MDD 为 0.46 [0.16 - 0.67]。在最近的五个发表中,这种一致性的提升更为显著,CAD、T2DM 和 MDD 的 ChronoAdd<sub>(Pub<sub>n</sub>)</sub>评分的中位 Jaccard 指数分别达到了 0.76 [0.75 - 0.92]、0.74 [0.74 - 0.80] 和 0.67 [0.61 - 0.93] 。

同时,ChronoAdd<sub>(Pub<sub>n</sub>)</sub>评分在遗传风险百分位估计上也更加稳定。以 CAD 为例,被 ChronoAdd<sub>(Pub<sub>Last</sub>)</sub>定义为前 10% 高风险的个体,在 Best<sub>(Pub<sub>n</sub>)</sub>评分中的中位百分位为 86 [79 - 91.5],而在 ChronoAdd<sub>(Pub<sub>n</sub>)</sub>评分中为 93 [87 - 97]。在关联分析中,ChronoAdd<sub>(Pub<sub>n</sub>)</sub>评分与疾病结局的关联也更强。CAD、T2DM 和 MDD 的 ChronoAdd<sub>(Pub<sub>n</sub>)</sub>评分中前 10% 个体的优势比(Odds Ratio,OR)显著高于 Best<sub>(Pub<sub>n</sub>)</sub>评分,并且 ChronoAdd<sub>(Pub<sub>n</sub>)</sub>评分的 Nagelkerke’s pseudo - R<sup>2</sup>和 C 统计量等指标也优于 Best<sub>(Pub<sub>n</sub>)</sub>评分 。

在研究结论和讨论部分,研究人员指出,高 PRS 分类的不稳定性与极端值理论中的尾独立性现象一致。不同的 PRS 可能由于训练过程中的多种因素,如 GWAS 的规模、训练数据集的组成、表型定义和评分方法的假设等,捕获了互补的预测信息,从而导致风险估计的不稳定。而整合评分的方法,如 ChronoAdd<sub>(Pub<sub>n</sub>)</sub>,能够通过顺序整合新的遗传关联数据,为高风险分类提供更稳定和可靠的框架,同时也提升了整体的 PRS 基于人群的指标。尽管该研究存在一些局限性,如使用现患疾病进行关联分析、采用住院和手术编码而非临床判定的结果进行疾病分类等,但 ChronoAdd<sub>(Pub<sub>n</sub>)</sub>方法在减少高风险分类的变异性、提高预测准确性方面展现出了巨大潜力,为临床实践中 PRS 的报告和更新提供了一个实用的框架,有望推动精准医学的发展,为患者提供更可靠的疾病风险评估和个性化的医疗服务。

在研究方法上,研究人员主要利用了以下关键技术:一是使用 AOU 队列,该队列包含了丰富的基因型数据和广泛的表型信息,为研究提供了充足的样本基础;二是通过 PLINK2 软件计算多基因评分,并对其进行质量控制和标准化处理;三是运用 PRSmix 框架进行多基因评分的整合,利用弹性网模型生成 ChronoAdd<sub>(Pub<sub>n</sub>)</sub>评分;四是采用逻辑回归、Harrell’s C 统计量、Nagelkerke’s pseudo - R<sup>2</sup>和 Jaccard 相似性指数等统计方法,对多基因评分与疾病结局的关联、预测能力和风险估计的一致性进行评估 。这些方法相互配合,使得研究能够全面深入地探讨 PRS 高风险分类的稳定性问题,并验证整合评分方法的有效性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号