《Nature Communications》:Fine-mapping a genome-wide meta-analysis of 98,374 migraine cases identifies 181 sets of candidate causal variants
编辑推荐:
本研究针对偏头痛全基因组关联研究(GWAS)已发现百余个风险位点但因果变异和基因大多未知的难题,通过对98,374例病例和869,160例对照进行荟萃分析,新发现35个风险位点,并利用FINEMAP对102个风险区域进行精细定位,定义了181个可信集合,识别出7个高后验包含概率(PIP>0.9)的变异和2个错义变异(NGF基因的rs6330和INPP5A基因的rs1133400),为理解偏头痛生物学机制和开发新疗法提供了关键线索。
偏头痛是一种高度流行的神经血管障碍,以反复发作的致残性严重头痛为特征,通常为单侧、搏动性,并伴有恶心、畏光、畏声等症状。全球疾病负担研究显示,偏头痛是导致残疾的第二大原因,全球终生患病率约为15%-20%,女性患病率是男性的三倍。家族和双胞胎研究估计其遗传力约为40%。全基因组关联研究(GWAS)已成功识别出超过一百个偏头痛风险基因座,然而,这些关联信号大多位于基因组的非编码区,其潜在的因果遗传变异(causal variants)和致病基因(causal genes)在很大程度上仍然是未知的。识别对偏头痛具有生物学效应的因果基因和变异,对于理解偏头痛的生物学基础以及开发新的有效治疗方法至关重要。统计精细定位(statistical fine-mapping)是解决这一问题的关键下一步,它能够将关联区域内的相关遗传变异缩小到数量更少的候选因果变异集合。然而,对大型荟萃分析(meta-analysis)结果进行可靠的精细定位已被证明非常困难,主要挑战在于难以获得精确的样本内连锁不平衡(in-sample LD)信息,以及不同研究间基因分型平台和基因型填充流程的差异可能导致结果偏差。
为了解决这一难题,由Heidi Hautakangas和Matti Pirinen等人领导的研究团队在《Nature Communications》上发表了他们的最新研究成果。他们进行了一项新的偏头痛GWAS荟萃分析,整合了英国生物样本库(UK Biobank)、23andMe公司和芬兰FinnGen项目的数据,共包含98,374例偏头痛病例和869,160例对照。他们不仅发现了122个独立的风险基因座(其中35个为新发现),更关键的是,他们系统评估了在只能使用参考面板连锁不平衡(reference LD)进行精细定位时,如何判断结果的可靠性,并成功地对大多数风险区域进行了高质量的精细定位。
研究人员为开展此项研究,运用了几个关键技术方法。首先是进行了大规模逆方差加权固定效应荟萃分析,整合了三个欧洲血统队列的GWAS汇总统计数据。其次,他们利用FINEMAP软件进行贝叶斯精细定位,并创新性地提出使用因果变异后验期望数量(PENC)作为评估参考LD精细映射结果可靠性的关键指标。此外,研究还包含了基因座定义、遗传相关性估计(LD Score回归)、以及利用Variant Effect Predictor(VEP)、GTEx和UK Biobank Pharma Proteomics Project等数据库进行变异功能注释和表达数量性状位点(eQTL)/蛋白质数量性状位点(pQTL)映射,并在FinnGen数据库中对候选变异进行了广泛的表现型全关联扫描(PheWAS)。
研究结果
发现122个偏头痛风险基因座
通过对三大研究的荟萃分析,共确定了122个独立的风险基因座。其中,35个为首次报道的新基因座。基因组成因膨胀因子(λGC)为1.38,LD Score回归截距为1.09,表明存在一定的混淆因素。在复制分析中,35个新基因座中的32个其效应方向与发现集一致。
评估不同LD面板在精细定位中的表现
研究重点探讨了在使用参考LD而非样本内LD时,如何评估精细定位结果的可靠性。他们在26个可获取样本内LD的区域进行了比较,发现FINEMAP软件输出的因果变异后验期望数量(PENC)能最有效地区分高质量和低质量的精细定位结果。当使用更精确的UKB-FG参考LD面板时,设定PENC>3作为阈值,可以有效地过滤掉因LD不匹配导致的低质量结果。
FINEMAP结果概览
对102个精细定位区域的分析显示,大多数区域提示存在一个(42%)或两个(46%)因果变异。共定义了181个不同的信号。获得了93个区域的高质量精细定位结果。其中,7个变异具有极高的后验包含概率(PIP > 0.9),被认为是因果变异的有力候选者。此外,发现了3个PIP > 0.5的错义变异(missense variant):位于NGF基因的rs6330(PIP=0.59)、位于INPP5A基因的rs1133400(PIP=0.93)以及位于SERPINA1基因的rs28929474(PIP=0.64,位于低质量区域)。
关键候选因果变异的生物学意义
- •
NGF(rs6330):神经生长因子β(NGFβ)在神经元发育、存活及疼痛、温度、触觉传导中起关键作用。该变异与多种肌肉骨骼系统疾病风险呈负相关。其受体NTRK1基因内也发现了两个错义变异(rs6339和rs6336),进一步支持了NGF通路在偏头痛中的潜在因果作用。针对NGF或其受体的疗法已在其他慢性疼痛疾病中进行临床研究。
- •
INPP5A(rs1133400):该基因编码的膜相关肌醇多磷酸5-磷酸酶在细胞内钙动员中起核心作用,参与神经传递、激素分泌等多种细胞信号过程。该基因在小脑浦肯野细胞中高表达。
- •
PHACTR1(rs9349379):此位点是已知的最强偏头痛风险位点之一,本研究精细定位结果(PIP=1.00)强烈支持其内含子变异rs9349379为因果变异。该变异亦与多种血管疾病(如冠心病)显著相关,但效应方向相反。
- •
PheWAS揭示多效性:对候选变异的表现型全关联扫描(PheWAS)发现了大量与其他疾病/性状的关联,特别是在循环系统疾病、肌肉骨骼系统疾病和呼吸系统疾病等方面,揭示了这些遗传位点的多效性。
研究结论与意义
本研究成功地对一项大型偏头痛GWAS荟萃分析进行了系统性的精细定位,为91%的风险区域提供了高质量的精细定位结果。研究不仅新发现了35个偏头痛风险基因座,更重要的是提出了利用PENC统计量来评估基于参考LD的精细定位结果可靠性的实用策略,为未来类似研究提供了方法学借鉴。研究结果显著缩小了多个偏头痛风险区域内的候选因果变异范围,并特别指出了NGF和INPP5A基因内的错义变异是极有前景的致病候选者,为后续功能实验验证和靶向治疗开发指明了方向。尽管最终确定的精细定位分析需要比当前常见疾病GWAS荟萃分析更全面的数据,但本研究证明,通过合适的分析策略,已经可以从现有数据集中提取出可靠且新颖的精细定位结果,极大地推动了我们对偏头痛遗传基础的理解。