
-
生物通官微
陪你抓住生命科技
跳动的脉搏
MosCoverY:基于测序覆盖度数据估算Y染色体嵌合缺失的创新方法及其在人群研究与肿瘤基因组中的应用
【字体: 大 中 小 】 时间:2025年09月12日 来源:AJHG 9.8
编辑推荐:
为解决利用外显子或全基因组测序数据检测男性Y染色体嵌合缺失(mLOY)的难题,研究人员开发了MosCoverY方法。该方法通过筛选Y染色体单拷贝基因并利用GC含量与长度匹配的自体常染色体外显子进行覆盖度标准化,实现对mLOY的精准识别与定量。研究在UK Biobank等大型队列中验证了其与芯片及WGS方法的一致性,并成功复现了mLOY与年龄、吸烟、全因死亡率及遗传位点的已知关联,为大规模遗传流行病学研究提供了重要工具。
Y染色体嵌合缺失(mosaic loss of Y chromosome, mLOY)是男性中最常见的体细胞突变事件,其发生率随年龄增长而显著上升,并且与多种疾病风险密切相关,包括血液系统肿瘤、实体瘤、心血管疾病、阿尔茨海默病以及全因死亡率升高。尽管mLOY的重要性日益凸显,但其检测方法长期以来主要依赖于基因分型芯片技术,例如通过计算Y染色体男性特异区(male-specific region of Y, MSY)探针信号强度的中位数log R比值(mLRRY)或利用伪常染色体区域(pseudoautosomal regions, PARs)的等位基因强度不平衡(PAR-LOY法)进行推断。虽然这些方法在大型队列如UK Biobank中已得到广泛应用,但它们无法直接应用于日益普及的外显子或全基因组测序(whole-genome sequencing, WGS)数据。此外,Y染色体本身结构复杂,存在大量重复序列和与X染色体高度同源的区域,这为基于测序覆盖度的分析带来了巨大挑战。
针对上述问题,Valeriia Timonina等研究人员在《The American Journal of Human Genetics》上发表了题为“MosCoverY: A method to estimate mosaic loss of Y chromosome from sequencing coverage data”的研究论文,开发了一种名为MosCoverY的新方法,能够直接从外显子或全基因组测序数据中准确识别和定量mLOY。该方法的核心创新在于巧妙地规避了Y染色体的复杂结构:通过严格筛选位于X退化区域的单拷贝基因(如SRY、RPS4Y1、ZFY等13个基因),并针对每个Y染色体外显子,从不易发生拷贝数变异的常染色体区域中匹配100个GC含量和长度相近的外显子,用以标准化测序覆盖度,从而极大减少了GC偏好性和映射偏差带来的噪声。
为验证MosCoverY的效能,研究团队将其应用于UK Biobank中212,062名男性的外显子测序数据,并与基于芯片的mLRRY和PAR-LOY方法以及基于WGS的Control-FREEC软件的结果进行了全面比较。结果显示,MosCoverY检测到的mLOY携带者比例为5.6%,与mLRRY(5.4%)高度一致,而PAR-LOY因设定的细胞比例阈值较低,检测出了更多的携带者(10.1%)。三种方法共同识别出的mLOY个体具有最低的Y染色体标准化覆盖度,提示其细胞缺失比例最高。更重要的是,MosCoverY估算的mLOY细胞比例与另外两种方法以及WGS金标准结果均显示出极强的相关性(Pearson相关系数>0.8),尤其在WGS子集验证中,MosCoverY与Control-FREEC的相关性优于其他方法。
研究人员还通过一系列流行病学和遗传学分析进一步证实了MosCoverY的生物学有效性。他们发现,无论是二分类的mLOY状态还是连续的细胞比例估计,MosCoverY的结果均显示出与年龄和吸烟史最强关联的趋势,并且与全因死亡率的关联强度在高细胞比例阈值下最为显著。在遗传验证方面,利用MosCoverY表型进行的全基因组关联分析(GWAS)不仅复现了所有已知的mLOY易感位点(如chr14:101168739的rs56349439),而且在多数位点上获得了更低的p值,表明该方法在捕捉遗传信号方面具有更高的灵敏度。
除了在大型人群队列中的应用,研究还探索了MosCoverY在肿瘤研究中的潜力。通过对TCGA数据库中1,988名男性癌症患者的正常和肿瘤样本进行分析,发现肿瘤样本中mLOY的发生率(38%)远高于配对正常样本,且其频率和细胞比例在不同癌种间存在巨大异质性(例如肾乳头状腺癌中高达89%)。尽管肿瘤基因组的不稳定性给mLOY检测带来了额外挑战,但MosCoverY的结果与TCGA官方提供的基于SNP芯片和WGS的拷贝数分段数据高度一致,甚至优于不同技术间的一致性水平。
值得注意的是,MosCoverY在设计上依赖于队列数据以确定覆盖度分布的中位数和异常值阈值,这引发了其对单样本应用适用性的疑问。为解决这一问题,作者利用瑞士HIV队列研究(SHCS)的数据进行了测试,发现当使用与UK Biobank相同的捕获试剂盒(IDT xGen v.1)时,直接应用UKB推导的阈值仍能获得合理结果,但为求精准,建议对不同批次或捕获kit的数据分别进行标准化。
本研究开发并广泛验证的MosCoverY方法,成功解决了从测序数据中检测mLOY的技术瓶颈。其优势体现在以下几个方面:首先,它不依赖于配对正常样本或基因型信号,可直接应用于单一外显子或基因组样本;其次,通过精心设计的常染色体标准化策略,有效克服了Y染色体固有的技术难题;最后,它在保持高灵敏度和特异性的同时,提供了定量的细胞比例估计,这对于研究mLOY的剂量效应至关重要。
研究人员在讨论中指出,mLOY作为体细胞嵌合突变(mosaic chromosomal alterations, mCAs)中最常见的一类,与克隆造血(clonal hematopoiesis)和多种年龄相关疾病存在密切联系。MosCoverY的出现为在已产生海量测序数据的大型生物银行(如UK Biobank)中挖掘mLOY的健康影响提供了强大工具,有望进一步揭示其在男性衰老、癌症易感性和性别差异性疾病中的作用机制。未来研究可借助该方法深入开展mLOY与环境暴露、药物治疗和特定疾病预后的纵向关联分析。
主要技术方法:本研究利用UK Biobank(n=212,062)、瑞士HIV队列研究(SHCS, n=337)和癌症基因组图谱(TCGA, n=1,988)的男性外显子测序数据。核心方法MosCoverY通过mosdepth工具计算特定Y染色体单拷贝基因外显子的中位数覆盖度,并将其与100个GC含量和长度匹配的常染色体外显子覆盖度进行标准化,经群体水平缩放后得到个体Y染色体相对覆盖度估计值,进而通过统计学异常值阈值判定mLOY并换算为细胞比例。
研究结果
Estimation of mLOY from UKB exome sequencing data
MosCoverY在UK Biobank队列中成功估算出Y染色体的标准化覆盖度,识别出11,897名(5.6%)mLOY携带者,其检测结果与基于芯片的mLRRY和PAR-LOY方法高度一致,尤其在共同检出的个体中显示出最低的Y染色体覆盖度。定量细胞比例估计与其它方法强相关,且与WGS子集的金标准验证结果相关性最佳。
Effect of coverage on mLOY estimation accuracy
通过下采样实验证明,即使测序深度降至原始的10%,MosCoverY估算的Y染色体覆盖度仍与原始数据高度相关,表明该方法对测序深度波动具有良好鲁棒性。
Epidemiological validation of MosCoverY in the UKB
MosCoverY检测到的mLOY表现出与年龄和吸烟史的最强正相关关系。在调整年龄、吸烟状态和遗传背景后的生存分析中,MosCoverY定义的mLOY与全因死亡率显著相关,且当使用更高细胞比例阈值(≥20%)时,这种关联更为强烈。
Genetic validation of MosCoverY in the UKB
利用MosCoverY表型进行的GWAS发现了36个与二分类mLOY性状相关的独立遗传信号,以及59个与连续细胞比例相关的位点,其中绝大多数已知位点被复现,且多个位点显示出比传统方法更显著的关联强度。
Application to TCGA
在TCGA肿瘤样本中,MosCoverY检测到更高频率(38%)和更广泛变异的mLOY,其发生率与肿瘤类型密切相关。尽管肿瘤样本中Y染色体覆盖度分布更广,但MosCoverY的结果与基于SNP芯片和WGS的拷贝数数据高度一致。
Single-sample analysis using SHCS data
在SHCS队列中的验证表明,当使用相同捕获试剂盒时,跨队列应用UKB推导的阈值可行,但为保证精度,建议对不同技术批次的数据分别进行标准化处理。
研究结论与意义
本研究开发的MosCoverY方法首次实现了从外显子和全基因组测序数据中高效、准确地检测Y染色体嵌合缺失。该方法通过聚焦单拷贝基因和创新的常染色体标准化策略,有效解决了Y染色体结构复杂带来的技术挑战。在超过20万人的UK Biobank队列及其他独立数据集中的验证表明,其检测结果与现有金标准方法高度一致,且在重现mLOY与年龄、吸烟、死亡风险及遗传因素的已知关联方面表现优异甚至更优。此外,该方法在肿瘤基因组中的成功应用拓展了其使用场景。MosCoverY为利用现有大规模测序数据研究mLOY的流行病学、遗传学和临床意义提供了强大工具,将极大推动对男性衰老、癌症发展及性别特异性疾病机制的理解。所有分析代码已开源,促进学术界的广泛使用和进一步开发。
生物通微信公众号
知名企业招聘