编辑推荐:
本文聚焦 X 染色体在复杂性状遗传中的作用。通过分析大规模生物样本库数据,发现 X 染色体对复杂性状有贡献,其遗传模式受剂量补偿机制影响,如 X 染色体失活(XCI)等,研究为揭示相关遗传机制提供了重要依据。
一、引言
全基因组关联研究(GWASs)已发现众多与复杂性状和疾病相关的常染色体变异,但 X 染色体(chrX)相关研究滞后。chrX 虽占人类基因组约 5% 且含至少 800 个蛋白质编码基因,但在已发表的 GWASs 中,仅约 25% 报告了 chrX 分析。
chrX 独特生物学特性带来分析和解释难题。在大多数哺乳动物中,雌性有两条 chrX(XX 核型),雄性只有一条(XY 核型),雄性 chrX 的非假常染色体区域(non - PAR)呈半合子状态。为平衡 chrX 剂量差异,存在 chrX 特异性调节过程,包括随机 X 染色体失活(XCI)和 X 连锁基因表达上调。
XCI 使雌性体细胞中一条 chrX 随机失活,实现两性间活性剂量平衡,不过人类中约 25% 的 chrX 基因可逃避 XCI。关于 X 染色体上调的证据存在争议,基因表达研究表明 chrX 基因存在部分转录上调。大规模遗传数据有助于探究 chrX 与常染色体在复杂性状中的关系,但现有 GWAS 工具对 chrX 分析的假设不同,影响了对剂量补偿机制的推断。本研究旨在利用英国生物银行(UKB)和芬兰基因库(FinnGen)数据,深入剖析 chrX 在复杂性状遗传中的作用及剂量补偿机制的影响。
二、材料和方法
(一)chrX 生物学特性在 GWASs 中的复杂性及后果
chrX 的非 PAR 区域分析面临挑战,主要源于两性 chrX 拷贝数差异和雌性的 XCI。GWAS 工具常用的编码系统将雌性基因型编码为 {0,1,2},雄性编码为 {0,2}。在假设完全 XCI 且两性活性等位基因效应相等的情况下,男性 GWAS 检测非零效应的统计功效高于女性,因为 chrX 位点在男性中解释的性状方差是女性的两倍。在性别联合 GWAS 中,检测男性偏倚位点的功效大于女性偏倚位点。此外,逃避 XCI 理论上会增加女性的遗传效应和加性遗传方差,但由于性别联合 GWAS 中的功效偏倚,可能低估潜在逃避位点的比例。
(二)UKB 中的基因型和表型数据
本研究使用 UKB 的基因型数据集(推测基因型数据第 3 版),样本需满足多项质量控制标准,如非杂合性和缺失率异常值、无性染色体非整倍体、报告性别与推断性别一致且纳入亲缘关系计算等。研究聚焦于无亲缘关系的英国白人个体,并去除了退出研究的个体。
对表型数据进行了多种处理,包括分别对男性和女性的表型进行适当协变量调整和反正态转换,去除异常值。对于重复测量的性状取平均值,对服用血压药物的个体进行血压值校正,对部分血液和尿液生物标志物进行他汀类药物使用调整,还筛选了非生物标志物定量性状用于后续分析。
(三)UKB 中的全基因组关联分析
在所有分析中,将 chrX 的非 PAR 基因型按上述编码系统处理,使用 BOLT - LMM v.2.3.2 对常染色体和 chrX(包括 PAR 和非 PAR)进行性别特异性和性别联合 GWAS 分析。选择满足一定条件的直接基因分型变异和推测变异作为模型单核苷酸多态性(SNP),用于估计遗传关系矩阵和调整 GWAS 以消除混杂因素。
(四)在 FinnGen 中的验证
FinnGen 数据发布 10 包含 430,897 名芬兰个体的基因分型数据。对身高、体重指数(BMI)和体重进行性别特异性 GWAS 分析,使用 REGENIE v.2.2.4 流程,纳入与 UKB GWASs 相似的协变量。
(五)chrX 和常染色体中 SNP 遗传力及效应大小分布的估计
GENESIS 是一种基于似然性估计效应大小分布和遗传力的方法,默认仅分析常染色体摘要统计信息。本研究对其进行扩展以纳入 chrX 分析,提取 chrX 的标签 SNP 并计算相应的连锁不平衡(LD)分数。分析 chrX 和常染色体中常见变异的性别特异性摘要统计信息,使用两成分模型估计非零效应变异比例(πc)和每个因果变异解释的遗传力(σ2),进而计算 SNP 遗传力(h2)。同时,使用 LD 分数回归估计 48 个性状的 SNP 遗传力作为对比,并进行相关统计检验。
(六)chrX 影响的估计
定义 chrX 影响(XI)为 chrX 的 SNP 遗传力(h^X2)与常染色体的 SNP 遗传力(h^A2)之比,用于评估 chrX 在复杂性状遗传中的贡献。比较观察到的 XI 与两种理论场景下的预期值,场景一假设一个活性 chrX 等效于一对常染色体(X = AA),场景二假设一个活性 chrX 等效于一个常染色体(X = A)。通过不同方法估计?(chrX 与常染色体中对遗传力有贡献的变异数之比),并进行相关分析。
(七)领先变异的识别
利用性别特异性 GWAS 的摘要统计信息识别各性别相关区域,将 p 值低于5×10?8的 SNP 周围 0.5 Mb 区域定义为关联区域,合并重叠区域,区域内 p 值最小的变异视为领先变异。为比较常染色体和 chrX 的效应大小,对非 PAR 区域变异的效应大小估计值和标准误差乘以 2 以估计活性等位基因效应。还对 UKB 性别联合 GWAS 的每个关联区域进行条件分析。
(八)基于性别特异性遗传力的 XCI 场景分析
理论上,完全 XCI(F - XCI)时,chrX 中男性的hX,m2预期是女性的两倍;无 XCI(N - XCI)时,女性效应大小预期增加两倍,男性与女性hX2比值为 0.5;部分逃避 XCI(E - XCI)时,假设 25% 的 chrX 位点逃避 XCI,且根据基因表达研究结果建模,男性与女性hX2比值约为 1.75。应用 “linemodels” 包对 34 个性状的性别特异性h2估计值进行分析,将性状聚类到不同 XCI 模型,估计各模型的后验概率。
(九)全基因组变异的四成分性别偏倚混合模型
为检测全基因组变异的中等性别偏倚效应,构建并拟合四成分混合模型,包括零效应(M0)、女性偏倚效应(M1)、相等效应(M2)和男性偏倚效应(M3)。模型基于性别特异性摘要统计信息,对效应大小和标准误差进行缩放处理,设定先验分布和参数,估计非零效应方差(σ2)和各成分变异比例(πk),并计算变异属于各成分的概率,根据概率判断变异的性别偏倚类型。分析时排除主要组织相容性复合体(MHC)区域、缺失率大于 1%、次要等位基因频率(MAF)小于 0.01 以及哈迪 - 温伯格平衡检验 p 值小于10?7的变异,并进行 LD 修剪。
三、结果
(一)chrX 对复杂性状的贡献
对 UKB 中 48 个数量性状进行性别特异性 GWAS 分析,并在 FinnGen 中对部分性状进行验证。估计性别联合hX2发现,48 个 UKB 性状中有 45 个hX2估计值显著不为零,其中身高的hX2最高。比较hX2与hA2发现,两者呈正相关(Pearson’s r = 0.88),定义的 XI 中位数为 0.03,表明 chrX 对复杂性状遗传力的贡献约为常染色体的 3%。
在性别差异方面,男性的hX2普遍高于女性,男性中 X 连锁全基因组显著位点数量是女性的 2.3 倍;而常染色体hA2在两性间无系统性差异。XI 在男性中也显著高于女性,但舒张压和收缩压例外,这两个性状在女性中的 XI 更大。
(二)通过剂量补偿视角解读 XI
将 XI 结果与两种剂量补偿场景下的理论预期比较,发现观察到的 XI 中位数与预期值差异显著。在总体人群中,观察到的 XI(0.034)比 X = AA 场景下预期值(0.052)低 1.5 倍,比 X = A 场景下预期值(0.013)高 2.6 倍。对h2进行分解分析表明,观察到的 XI 与理论预期的差异源于效应大小,而非多基因性差异。总体上,chrX 中常见变异的活性等位基因效应比常染色体大,这解释了 XI 高于 X = A 场景预期值的现象。
(三)chrX 与常染色体活性等位基因效应的比较
比较 chrX 和常染色体领先变异的活性等位基因效应,发现 chrX 中活性等位基因效应(aX)在男性和女性中分别比常染色体(aA)高 1.9 倍和 1.8 倍。使用 FinnGen 数据对部分性状相关变异进行验证,结果仍显示 chrX 的活性等位基因效应更高。chrX 中活性等位基因效应更大的现象不受变异频率、功能后果和致病性影响,但在最受限制区域可能受负选择影响。
(四)通过性别特异性遗传力比较洞察 XCI 逃避
应用贝叶斯方法将性状聚类到不同 XCI 模型,发现多数性状难以区分 F - XCI 和 E - XCI 模型。舒张压和收缩压聚类到 N - XCI 模型,其性别差异可能由激素等其他因素影响。身高是唯一由 E - XCI 模型最佳解释的性状,FinnGen 数据也验证了这一结果,表明 chrX 上逃避 XCI 的位点可能对人类身高有潜在作用。
(五)chrX 与常染色体性别偏倚效应的比较
应用混合模型分析 chrX 和常染色体变异的性别偏倚效应,发现 chrX 中性别间遗传效应相等的关联比例比常染色体少,主要是由于男性偏倚效应比例增加。对于腰臀比,常染色体中多数非零变异为女性偏倚,而 chrX 中女性偏倚变异比例较小。在身高方面,chrX 中非零变异的女性偏倚效应比例比常染色体高,在 FinnGen 中也得到验证。定位到与身高相关的女性偏倚位点 rs59648890,位于 ITM2A 基因上游,其在两性中的效应差异与部分逃避 XCI 相符。
四、讨论
chrX 在 GWASs 中研究不足,本研究通过分析大规模数据,揭示了 chrX 对复杂性状遗传的贡献及相关机制。研究支持近乎完全的 XCI 和 chrX 与常染色体间的剂量补偿机制,chrX 活性等位基因效应比常染色体大,但小于 2 倍,这与 Ohno 提出的 X 上调假说相符,不过两者是否存在共同机制有待进一步研究。
chrX 对男性表型变异的贡献平均是女性的两倍,这与男性半合子状态和 XCI 有关,但 chrX 遗传力的性别差异在当前样本量下对全基因组性状遗传力估计影响不显著,且 chrX 的加性效应难以解释复杂表型中的女性偏倚。
虽然理论上可利用 chrX 遗传数据识别逃避区域和受影响性状,但实际评估困难,仅在身高性状中发现了部分逃避 XCI 的证据,且对相关位点的验证和机制剖析还需进一步开展。综合来看,XCI 和 X 上调两种剂量补偿机制共同作用,平衡了 chrX 在群体中的作用。
本研究主要聚焦于 chrX 的加性遗传变异,chrX 的独特特征可能使其他类型效应在某些情况下更重要,如 X 连锁有害等位基因和偏斜的 XCI。研究还存在局限性,UKB 存在性别差异参与偏倚,虽在 FinnGen 中进行了验证,但个体位点的性别偏倚效应在不同生物样本库中重复性差,反映了检测基因与环境相互作用的挑战。
随着多数 GWAS 工具支持 chrX 分析,纳入 chrX 研究有助于揭示新的生物学机制和性状遗传力。但在分析 chrX 时,需注意剂量补偿假设对结果解释的影响,以及性别间检测功效差异可能导致的偏倚。随着 GWAS 样本量增加,逃避 XCI 的潜在影响可能会更加明显。总之,chrX 的 GWAS 数据不仅能发现新的复杂性状关联,还为探究其独特生物学特性提供了契机。
五、数据和代码可用性
男性和女性 GWAS 摘要统计数据、性别联合 GWAS 中身高的摘要统计数据可在指定网址获取,本研究使用的代码可在相应 GitHub 仓库获取。
六、致谢
感谢 UK Biobank 和 FinnGen 的参与者、研究人员及相关团队,研究得到了多个机构和基金的支持,部分图表由 BioRender 创建。
七、作者贡献
研究的概念化由 T.T.、M.P. 和 Y.F. 完成;数据的获取、分析和解释由 T.T.、M.P.、Y.F.、A.K. 和 S.R. 负责;Y.F. 和 T.T. 起草了手稿;T.T.、M.P. 和 Y.F. 对稿件进行了批判性修订和编辑;Y.F. 进行了可视化处理;T.T. 和 M.P. 承担了监督工作。
八、利益声明
A.K. 是 Nightingale Health Plc 的现任员工。