基因-环境与基因-基因互作的挖掘:检测方差数量性状位点的参数与非参数方法比较研究

【字体: 时间:2025年09月02日 来源:Frontiers in Genetics 2.8

编辑推荐:

  这篇综述系统比较了三种参数化方法(DRM、BF、DGLM)和两种非参数方法(KW、QUAIL)在检测方差数量性状位点(vQTL)时的表现。通过蒙特卡洛模拟评估假阳性率(FPR)、统计功效和计算时间,发现偏离回归模型(DRM)和Kruskal-Wallis检验(KW)分别在参数和非参数方法中最优。研究进一步将KW应用于台湾生物银行(TWB)的四种血脂性状数据,证实vQTL能有效富集基因-环境(GxE)和基因-基因(GxG)互作,为大规模遗传互作研究提供了方法学指导。

  

基因与环境及基因间互作检测方法学比较

引言

检测方差数量性状位点(variance quantitative trait loci, vQTL)是发现基因-环境(GxE)和基因-基因(GxG)互作的重要途径。在直接进行GxE和GxG分析前先识别vQTL,可显著减少检验次数并降低多重检验惩罚。尽管已有多种vQTL检测方法,但关于假阳性率(FPR)、统计功效和计算时间的系统比较研究仍然缺乏。本研究对三种参数化方法和两种非参数化vQTL检测方法进行了头对头比较。

材料与方法

研究采用台湾生物银行(TWB)147,836名30-70岁个体的全基因组数据,通过IMPUTE2软件进行基因型填充。质量控制后保留9,814,944个常染色体变异。分析聚焦四种血脂性状:高密度脂蛋白胆固醇(HDL)、低密度脂蛋白胆固醇(LDL)、甘油三酯(TG)和总胆固醇(TCHO)。

非参数vQTL方法

Kruskal-Wallis检验(KW)作为单因素方差分析的非参数对应方法,通过将表型值转换为组内中位数偏差的秩来评估方差异质性。分位数积分线性模型(QUAIL)基于分位数回归框架,整合100个分位数信息,但计算耗时长达KW的70-90倍。

参数vQTL方法

偏离回归模型(DRM)将基因型作为连续变量(0,1,2)回归分析;布朗-福赛斯检验(BF)通过ANOVA框架比较三组基因型的方差差异;双广义线性模型(DGLM)同时建模均值和方差效应,但对非正态性状敏感。

模拟研究结果

在正态分布性状中,DGLM表现出最高功效,但面对t分布(峰态分布)和χ2分布(偏态分布)时出现严重FPR膨胀。BF在次要等位基因频率(MAF)<0.2时FPR失控,而DRM表现稳健。KW在峰态分布中保持最优功效,在偏态分布中仅有轻微FPR膨胀。QUAIL虽能控制FPR,但功效始终未达最优且计算效率低下。

台湾生物银行数据分析

采用KW检测发现30个独立vQTL(LD r2<0.01),其中4个位点(rs4704208、rs11748027、rs483082、rs662799)与多个血脂性状相关。直接GxE分析显示:性别可减弱TG遗传效应,而BMI、饮酒和吸烟会增强效应。最显著的GxG互作出现在APOC1 rs438811与APOA5 rs662799之间(p=1.3×10-15),每个互作点可增加TG 5.9 mg/dL。

讨论与展望

vQTL筛选将GxE和GxG检测的检验次数从数百万级降至数百次。DRM和KW分别作为参数和非参数方法的优选方案,其中KW兼具计算效率和稳健性。近期发展的基于重尾分布的贝叶斯混合模型(Fan et al., 2025)为提升GxE检测稳健性提供了新思路。该研究为大规模遗传互作研究建立了方法学标准,特别针对复杂分布性状的分析提供了重要参考。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号