基于贝叶斯多基因评分概率转换(BPC)方法实现疾病风险的精准校准预测

【字体: 时间:2025年09月27日 来源:Nature Communications 15.7

编辑推荐:

  为解决多基因评分(PGS)在病例对照样本中校准不佳的问题,本研究开发了无需表型调优样本的贝叶斯多基因评分概率转换(BPC)方法。通过整合GWAS摘要统计、个体基因型和先验疾病概率,BPC在9种疾病中实现了优于现有方法的校准性能(ICI降低至0.024),为临床遗传风险评估提供了可直接解读的绝对风险值。

  
在精准医疗时代,多基因评分(Polygenic Scores, PGS)已成为评估个体遗传风险的重要工具。通过整合全基因组关联研究(Genome-Wide Association Studies, GWAS)中数千个单核苷酸多态性(SNP)的效应值,PGS能够量化个体对特定疾病或性状的遗传易感性。近年来,PGS在乳腺癌、冠状动脉疾病和2型糖尿病等复杂疾病中展现出与临床传统预测因子相媲美的潜力。然而,尽管PGS在群体水平的预测准确性不断提升(通过R2或AUC等指标衡量),其在个体层面的临床应用仍面临重大挑战:传统PGS通常以相对风险分位数(如top 5%)形式呈现,难以直接解读为个人绝对疾病风险概率。更关键的是,当前基于贝叶斯方法的PGS(如PRScs和SBayesR)虽在连续性状中表现良好校准,但在病例对照样本中会出现系统性的校准偏差——当样本中病例比例偏离人群患病率时,PGS预测值与真实风险间会产生显著差异。这种校准缺陷严重阻碍了PGS在临床场景中的实际应用,因为医生和患者需要的是能够直接指导决策的绝对风险概率(例如"30%患病可能性"),而非难以解释的统计量。
为破解这一难题,来自荷兰阿姆斯特丹自由大学、哈佛大学公共卫生学院等机构的研究团队在《Nature Communications》发表了开创性研究,开发了贝叶斯多基因评分概率转换(Bayesian polygenic score Probability Conversion, BPC)方法。该方法仅需GWAS摘要统计、个体基因型数据、先验疾病概率和人群患病率等公开数据,无需额外调优样本即可生成校准良好的疾病风险概率,为PGS的临床转化提供了实用化解决方案。
研究团队通过四个关键技术阶段实现突破:首先利用PRScs或SBayesR等贝叶斯方法计算标准化观察尺度(50%病例 ascertainment)的后验平均β值;接着通过liability scale转换公式将效应值转换至连续易感性尺度;然后基于群体参考样本(如1000 Genomes)中PGS的方差估计R2liability(易感性尺度解释方差);最后应用贝叶斯定理将先验概率更新为后验疾病概率。特别值得注意的是,BPC创新性地通过无表型数据的群体参考样本估计R2liability,突破了传统方法需要调优样本的局限。
模拟分析验证校准优越性
通过100次重复模拟(1000个独立SNP,R2liability为1%-15%,患病率K=0.01-0.15),BPC在全部参数条件下均保持优异校准性能(ICI范围0.008-0.026),显著优于Pain等人方法(ICI 0.039-0.118)。当疾病患病率较低而遗传率较高时,BPC的优势尤为突出——例如在K=0.01且R2liability=0.15时,BPC的ICI(0.026±0.002)较对比方法降低达65%。线性rescaling方法虽表现尚可,但会出现概率值超出[0,1]范围的问题,而BPC通过严格的概率分布建模避免了这一缺陷。
实证分析涵盖九大疾病类型
在精神分裂症(SCZ)、重度抑郁(MD)、乳腺癌(BC)、冠状动脉疾病(CAD)、炎症性肠病(IBD)、多发性硬化(MS)、前列腺癌(PC)、类风湿关节炎(RA)和2型糖尿病(T2D)等九种疾病中,BPC-PRScs达到最低平均ICI值(0.024±0.002),优于BPC-SBayesR(0.034±0.004)和Pain方法(0.053±0.007)。校准曲线显示,Pain方法在八种疾病中存在系统性高估风险的趋势,特别是在群体患病率较低而遗传率较高的自身免疫性疾病(如IBD、MS、RA)中尤为明显。当先验概率设置为0.5(模拟临床就诊人群的高风险场景)时,BPC-PRScs在除2型糖尿病外的所有疾病中均显示最佳校准。
关键技术假设的充分验证
研究通过多维度验证证实了BPC核心假设的合理性:PGS在病例和对照中的正态分布假设在所有现实参数条件下均成立(仅当R2liability=0.6等非现实场景下出现偏差);liability scale转换准确性得到验证(回归斜率≈1,截距≈0);后验概率对先验的依赖性分析表明,风险预测并非由先验主导(标准差达0.3),确保了遗传信息的贡献度。
与调优方法的性能对标
当调优样本规模小于200病例+200对照时,BPC与基于逻辑回归的调优方法(Logit-tuned)校准性能相当(ICI差值<0.01);当调优样本扩大时,调优方法虽具有约0.015的ICI优势,但研究者认为BPC无需调优样本的便利性(ICI<0.03已满足临床需求)更具实用价值。这一发现尤其重要,因为许多疾病领域难以获取大规模基因型-表型匹配数据。
R2liability估计方法的准确性突破
BPC通过群体参考样本中PGS方差估计R2liability的方法,较Pain方法采用的lassosum估计显著更接近真实值(模拟中绝对差异0.009-0.011 vs. 0.058-0.088;实证中0.02 vs. 0.05)。这一创新不仅提高了概率转换的准确性,更证实了贝叶斯PGS在潜在易感性尺度上的良好校准特性。
研究结论强调,BPC方法首次实现了在无需调优样本的前提下,将PGS转换为临床可解读的绝对风险概率,解决了PGS临床转化中的核心瓶颈。通过系统验证,BPC在多种疾病类型和不同先验概率场景下均保持稳健校准,其性能优于现有唯一可比方法。值得注意的是,方法适用性依赖于PGS的正态分布假设(除APOE等超大效应位点需特殊处理)和人群匹配(当前主要适用于欧洲血统个体)。研究者指出,未来研究方向应包括:扩展至非欧洲人群、整合家族史等相关协变量、开发动态风险预测模型以及探索与罕见变异风险的整合框架。
这项研究为多基因评分的临床化应用奠定了方法学基础,使个体化遗传风险评估向"点击即得"的实用化目标迈出关键一步。随着GWAS样本规模的持续扩大和PGS预测力的提升,BPC框架有望成为临床遗传风险评估的标准工具,最终实现复杂疾病风险预测的精准化与普及化。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号