RNA剪接数量性状位点统计建模的深度探索揭示神经退行性疾病风险变异
《AJHG》:A deep dive into statistical modeling of RNA splicing QTLs reveals variants that explain neurodegenerative disease
【字体:
大
中
小
】
时间:2025年11月13日
来源:AJHG 9.8
编辑推荐:
本研究针对当前sQTL检测方法漏检大量疾病相关遗传变异的局限性,开发了MAJIQTL统计框架。通过整合多维度剪接表征、加权多重假设检验校正和β-二项复合检验模型,在GTEx数据中显著提升sQTL检测效能,发现更多与神经退行性疾病GWAS信号共定位的功能性变异,并实验验证rs528823通过调控MS4A3外显子跳跃参与阿尔茨海默病机制。该研究为解析疾病分子通路提供了新方法学支持。
随着基因组学研究的深入,科学家们发现许多与疾病相关的遗传变异并不直接改变蛋白质编码序列,而是通过调控基因表达水平发挥作用。这类调控变异被称为数量性状位点(QTL),其中研究最广泛的是表达数量性状位点(eQTL)。然而,越来越多的证据表明,仅用eQTL无法完全解释疾病相关的遗传信号,特别是在神经退行性疾病中。这就引出了一个重要问题:是否存在其他类型的分子QTL能够填补这一空白?
RNA剪接作为基因表达调控的关键环节,自然成为了科学家们关注的焦点。剪接数量性状位点(sQTL)是指那些影响RNA剪接过程的遗传变异。理论上,sQTL应该能够解释eQTL无法覆盖的疾病关联信号。但现实情况是,现有的sQTL检测方法存在明显局限性,导致许多真正的疾病相关sQTL被遗漏。
为什么现有的sQTL检测方法会漏掉这么多重要信号?问题主要出在三个方面:剪接事件的表征不够全面、统计模型存在校准问题、以及对影响检测效能的协变量考虑不足。
为了解决这些问题,David Wang、Yoseph Barash等研究人员在《The American Journal of Human Genetics》上发表了他们的最新研究成果。他们开发了一个名为MAJIQTL的新框架,该框架通过三个核心创新显著提升了sQTL检测的准确性和广度。
研究团队利用GTEx项目中五个代表性组织(全血、肺、小脑、肝脏和心脏)的RNA测序数据,开发了一套完整的分析流程。MAJIQTL整合了MAJIQ剪接定量和Salmon转录本定量,能够捕捉从经典剪接事件到复杂剪接模式的全景信息。统计方法上,团队提出了加权多重检验校正策略,通过高斯过程回归建模检测效能相关的协变量(如变异位点与剪接位点的距离、junction覆盖度),并采用β-二项回归模型进行效应值推断,解决了传统线性模型对剪接数据离散性和异方差性不适配的问题。
比较MAJIQ与LeafCutter两种剪接定量方法在GTEx五类组织中的表现,发现MAJIQ能够额外识别出大量内含子保留事件相关基因(iGenes)和异构体水平差异基因(isoGenes)。例如在小脑和心脏组织中,MAJIQ检测到的iGenes数量是LeafCutter的1.4-2倍,证明综合剪接表征可显著提升遗传效应检测的全面性。
研究团队开发的新型加权检验方法通过高斯过程回归学习检测效能协变量(变异与剪接位点距离、缺失率)与局部错误发现率的关系,重新分配家族wise错误率(FWER)预算。在错误发现率(FDR)控制在0.05水平时,该方法比标准max-T检验多发现12%的剪接基因(sGenes),且通过置换实验验证其假阳性控制能力符合理论预期。
与传统线性回归和RINT(Rank Inverse Normal Transform)转换相比,β-二项回归模型在32种模拟场景中均表现出最优的假阳性控制能力和检测效能。该模型特别擅长处理低覆盖度(<50 reads)和极端Ψ值(接近0或1)情况下的效应值估计,其输出的优势比(Odds Ratio)指标与剪接竞争生物学模型更为契合。
针对传统基于P值筛选忽略估计精度的问题,研究提出复合检验策略:设定效应值阈值θ,检验H0:|β|≤θ vs H1:|β|>θ。该方法产生非线性决策边界,对高方差估计(如低次要等位基因频率或低测序覆盖度)要求更严格的证据,在控制假阳性率的同时,显著提升了对剪接破坏变异(SpliceAI delta score>0.2)的富集效果。
应用MAJIQTL分析GTEx数据,发现与阿尔茨海默病(AD)和帕金森病(PD)GWAS信号共定位(PPH4>0.5)的sQTL数量比传统方法提升87%和92%。重点验证了rs528823(chr11:59842342),该变异与AD显著相关(p=1.27e-8),是MS4A3基因外显子7跳跃的sQTL(p=3.55e-7),但不影响基因表达(eQTL p=5.51e-2)。机制上,rs528823位于YBX3结合 motif内,反义寡核苷酸(ASO)阻断实验证实该位点调控外显子7跳跃,YBX3敲低(KD)也重现类似剪接变化,提示该变异通过破坏RNA结合蛋白调控剪接的致病机制。
MAJIQTL通过综合解决现有sQTL检测的三大瓶颈问题,显著提升了对神经退行性疾病相关遗传变异的解析能力。该方法不仅发现更多与疾病共定位的sQTL,还通过效应值精确估计和复合检验策略实现功能变异的优先排序。对rs528823的机制阐释展示了sQTL研究在揭示非编码变异致病机制方面的独特价值。该框架为复杂疾病遗传学研究提供了一套更灵敏、更可靠的分析工具,有望推动更多疾病相关剪接变异的发现和功能验证。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号