
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多基因风险评分与性状关联分析指南:精神分裂症案例解析与实践教程
《Frontiers in Psychiatry》:Association analysis between polygenic risk scores and traits: practical guidelines and tutorial with an illustrative data set of schizophrenia
【字体: 大 中 小 】 时间:2025年08月22日 来源:Frontiers in Psychiatry 3.2
编辑推荐:
这篇综述为多基因风险评分(PRS)研究提供了系统指南,重点解析PRS与性状关联分析中的统计建模、交互作用检验和模型验证流程。文章通过精神分裂症相关数据集演示了线性/逻辑回归中协变量调整、R2/伪R2评估、异方差处理等关键步骤,强调忽略交互项可能导致关联信号丢失。配套的R代码和四个工作案例(Working Examples)为研究者提供了从PRS排序到非线性数据转换的完整解决方案。
多基因风险评分(PRS)与性状关联分析指南
1 引言
多基因风险评分(PRS)作为个体遗传易感性的量化指标,基于全基因组关联研究(GWAS)结果计算而来。传统分析方法通常通过线性或逻辑回归模型评估PRS与目标性状的关联性,并调整性别、年龄等协变量。然而,这种标准化流程可能掩盖重要生物学信息——例如PRS与协变量的交互作用,或忽视模型验证导致假阳性结论。
2 分析指南框架
2.1 模型选择策略
研究提出四种全模型(FM)构建方案:基础模型(FMWI)、含性别交互项模型(FMSex)、含诊断交互项模型(FMDiag)及双交互项模型(FMSex/Diag)。通过精神分裂症案例展示,当PRS与性别存在交互作用时,仅使用基础模型会导致男性组显著关联(p=0.0101)被掩盖(p=0.0764)。
2.2 PRS优先级排序
针对Clumping+Thresholding方法产生的106个PRS,提出半自动化筛选流程:
连续性状:计算各模型R2总和(S值)
二元性状:采用Nagelkerke伪R2或判别系数D
通过可视化排序图(如图2),研究者可依据S值断层现象确定需深入分析的PRS候选集。
2.3 模型验证与修正
线性回归需验证三大假设:
线性:通过性状-PRS散点图判断
正态性:Shapiro检验(p<0.05时需平方根/对数变换)
同方差性:Levene检验
当CAPE阴性评分(连续变量)残差非正态时(p=4.335e-06),平方根变换使p值提升至0.0811,成功满足建模条件。
2.4 二元性状特殊处理
针对二元性状(如CAPE阳性分组),需额外检验过离散现象。若残差偏差/自由度>>1,应采用准二项分布模型。精神分裂症案例中,PRS.15在性别分层分析中展现显著差异:男性组OR=2.109(p=0.0101),女性组无关联(p=0.9910)。
3 真实数据集应用
227名健康受试者的 psychotic-like experiences(PLEs)数据分析显示:
阴性症状:PRS.13(p值阈值=0.07)经变换后显著关联(p=0.045)
阳性症状:PRS.15(阈值=0.09)存在性别特异性效应
通过置换检验验证,PRS.13使模型解释方差提升1.97%(p=0.0033)。
4 方法学启示
研究强调交互作用检验的临床价值——在精神分裂症案例中,忽略性别交互项将导致50%关联信号丢失。同时揭示自动化分析的局限性:未经验证的模型可能产生膨胀的统计显著性(如异方差使p值虚低)。配套的GitHub资源(含R脚本与示例数据集)为方法落地提供实践支持。
该指南突破传统PRS分析范式,将统计严谨性与临床解释性相结合,为复杂性状遗传架构解析树立新标准。
生物通微信公众号