多基因风险评分与性状关联分析指南:精神分裂症案例解析与实践教程

《Frontiers in Psychiatry》:Association analysis between polygenic risk scores and traits: practical guidelines and tutorial with an illustrative data set of schizophrenia

【字体: 时间:2025年08月22日 来源:Frontiers in Psychiatry 3.2

编辑推荐:

  这篇综述为多基因风险评分(PRS)研究提供了系统指南,重点解析PRS与性状关联分析中的统计建模、交互作用检验和模型验证流程。文章通过精神分裂症相关数据集演示了线性/逻辑回归中协变量调整、R2/伪R2评估、异方差处理等关键步骤,强调忽略交互项可能导致关联信号丢失。配套的R代码和四个工作案例(Working Examples)为研究者提供了从PRS排序到非线性数据转换的完整解决方案。

  

多基因风险评分(PRS)与性状关联分析指南

1 引言

多基因风险评分(PRS)作为个体遗传易感性的量化指标,基于全基因组关联研究(GWAS)结果计算而来。传统分析方法通常通过线性或逻辑回归模型评估PRS与目标性状的关联性,并调整性别、年龄等协变量。然而,这种标准化流程可能掩盖重要生物学信息——例如PRS与协变量的交互作用,或忽视模型验证导致假阳性结论。

2 分析指南框架

2.1 模型选择策略

研究提出四种全模型(FM)构建方案:基础模型(FMWI)、含性别交互项模型(FMSex)、含诊断交互项模型(FMDiag)及双交互项模型(FMSex/Diag)。通过精神分裂症案例展示,当PRS与性别存在交互作用时,仅使用基础模型会导致男性组显著关联(p=0.0101)被掩盖(p=0.0764)。

2.2 PRS优先级排序

针对Clumping+Thresholding方法产生的106个PRS,提出半自动化筛选流程:

  • 连续性状:计算各模型R2总和(S值)

  • 二元性状:采用Nagelkerke伪R2或判别系数D

    通过可视化排序图(如图2),研究者可依据S值断层现象确定需深入分析的PRS候选集。

2.3 模型验证与修正

线性回归需验证三大假设:

  1. 1.

    线性:通过性状-PRS散点图判断

  2. 2.

    正态性:Shapiro检验(p<0.05时需平方根/对数变换)

  3. 3.

    同方差性:Levene检验

    当CAPE阴性评分(连续变量)残差非正态时(p=4.335e-06),平方根变换使p值提升至0.0811,成功满足建模条件。

2.4 二元性状特殊处理

针对二元性状(如CAPE阳性分组),需额外检验过离散现象。若残差偏差/自由度>>1,应采用准二项分布模型。精神分裂症案例中,PRS.15在性别分层分析中展现显著差异:男性组OR=2.109(p=0.0101),女性组无关联(p=0.9910)。

3 真实数据集应用

227名健康受试者的 psychotic-like experiences(PLEs)数据分析显示:

  • 阴性症状:PRS.13(p值阈值=0.07)经变换后显著关联(p=0.045)

  • 阳性症状:PRS.15(阈值=0.09)存在性别特异性效应

    通过置换检验验证,PRS.13使模型解释方差提升1.97%(p=0.0033)。

4 方法学启示

研究强调交互作用检验的临床价值——在精神分裂症案例中,忽略性别交互项将导致50%关联信号丢失。同时揭示自动化分析的局限性:未经验证的模型可能产生膨胀的统计显著性(如异方差使p值虚低)。配套的GitHub资源(含R脚本与示例数据集)为方法落地提供实践支持。

该指南突破传统PRS分析范式,将统计严谨性与临床解释性相结合,为复杂性状遗传架构解析树立新标准。

相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号