近交系小鼠基因组串联重复序列图谱:揭示遗传变异与表型关联的新资源

《iScience》:A tandem repeat atlas for the genome of inbred mouse strains: A genetic variation resource

【字体: 时间:2025年10月17日 来源:iScience 4.1

编辑推荐:

  本研究针对小鼠基因组中串联重复序列(TR)变异缺乏系统性图谱的问题,利用长读长测序技术对39个近交系小鼠品系进行全基因组分析,构建了包含2,528,854个TR等位基因的综合性数据库。研究发现小鼠TRs主要位于基因间区,且不同于人类,未发现与重复扩展疾病相关的大规模重复扩展。通过分析PL/J精子畸形和NZB大脑发育异常两个长期未解的表型,证实了品系特异性TR等位基因在Prdm9和Cacna2d3基因中的致病作用,为解析"缺失遗传力"提供了新视角。

  
在基因组学研究领域,串联重复序列(Tandem Repeats, TRs)作为一类重要的遗传变异形式,长期以来被认为是人类遗传疾病和表型多样性的关键因素。这些由短基序重复拷贝组成的序列,虽然占人类基因组的6-8%,却与超过65种神经性和14种神经肌肉疾病相关,包括亨廷顿病和脆性X综合征。更引人注目的是,近年研究发现TR等位基因与身高、毛发形态等复杂性状密切相关,甚至是青光眼和结直肠癌风险的最大贡献者。然而,尽管TRs在人类遗传学中的重要性日益凸显,科学界对小鼠——这一生物医学研究中最常用的模式生物——的TR变异全景仍知之甚少。
这种认知差距主要源于技术限制:以往的小鼠TR研究多基于短读长测序,难以准确解析重复丰富的基因组区域;使用的分析软件也非最优选择;且覆盖的品系数量有限。这种局限性直接导致了一个重要问题:许多在小鼠中观察了数十年的品系特异性表型,其遗传基础至今未能完全阐明。例如,PL/J小鼠品系自1981年就被发现存在高达42%的精子形态异常,NZB小鼠则自1985年以来多次被报道具有大脑发育异常和空间记忆增强等表型,但这些现象的分子机制始终是未解之谜。
正是在这一背景下,斯坦福大学医学院麻醉、疼痛与围术期医学系的Gary Peltz教授团队开展了这项开创性研究。研究人员利用太平洋生物科学公司(PacBio)的高保真(HiFi)长读长测序技术,结合最先进的计算分析流程,对40个近交系小鼠品系(包括35个经典品系和4个野生衍生品系)进行了全基因组TR系统性鉴定。这项发表于《iScience》的研究,成功构建了包含2,528,854个TR等位基因的综合性图谱,为理解小鼠遗传多样性提供了全新视角。
研究团队采用的技术方法主要包括:基于PacBio Revio平台的全基因组长读长测序;使用TRGT(Tandem Repeat Genotyping Tool)软件进行TR基因分型;通过完美重复查找器(perfect_repeat_finder.py)识别参考基因组中的TR位点;利用PopLDdecay进行连锁不平衡(Linkage Disequilibrium, LD)分析;采用fastreeR构建系统发育树。所有分析均以GRCm39小鼠参考基因组为基准,样本来源于杰克逊实验室提供的40个品系的雄性小鼠肝脏或脾脏组织。
TRs的基因组分布特征
研究人员发现,小鼠TRs在基因组中的分布模式与人类相似:大多数位于基因间区(57%)和内含子区(39%),仅有少量位于外显子(3.1%)、3'UTR(1.2%)、5'UTR(0.2%)等区域。就基序长度而言,二核苷酸重复(如AC、GT等)最为丰富(1,573,675个),而基序长度大于6bp的TRs则相对罕见。值得注意的是,约30.8%的TRs实际上是单核苷酸同聚物(如poly-T),被算法识别为"TT"重复。
与人类TRs的物种差异
研究发现了一个关键物种差异:尽管人类中存在大量与疾病相关的TR扩展(如强直性肌营养不良2型需要50-11,000次重复),但在小鼠中,即使是人类TR扩展疾病基因的同源基因,其TR等位基因的重复次数也与参考品系相差不到2次。这些小鼠TRs仅插入或删除1-2个氨基酸,且不破坏蛋白质阅读框,表明近交系小鼠缺乏人类中常见的大规模致病性重复扩展。
TRs与转座元件的关联分析
与人类TRs富集于Alu元件附近不同,研究人员发现小鼠TRs与LINE-1(长散在核元件)转座元件没有显著关联。96%的小鼠TRs距离最近的LINE-1元件超过200bp,仅有不到4%的TRs位于LINE-1内部或附近,这一发现挑战了关于TRs与转座元件共定位的传统认知。
连锁不平衡模式
研究团队比较了不同类型遗传变异的连锁不平衡(LD)衰减模式。结果显示,TRs具有最高的初始LD值(r2= 0.85),但衰减速度最快,半衰距离仅为0.1kb。相比之下,单核苷酸多态性(SNPs)的LD衰减距离为133-177kb,结构变异(SVs)为291kb。这种快速衰减特性使得TRs在精细定位遗传关联时具有独特优势。
系统发育分析
基于SNP、SV和TR三种变异类型构建的系统发育树,总体上反映了近交系小鼠品系间已知的进化关系。野生衍生品系(如WSB、MOLF等)与经典品系明显分离;NZW、NZO和NZB品系聚集在同一分支;DBA1J和DBA2J形成独立群集。然而,TR-based分析将C57BL/6J置于独立分支,与基于SNP和SV的分析结果有所不同,提示不同类型变异的突变机制和发生时机存在差异。
TR等位基因与表型关联
研究最引人注目的发现是,通过分析品系特异性TR等位基因,为两个长期未解的表型提供了遗传解释。在PL/J品系中,研究人员在Prdm9基因中发现了一个独特的TR等位基因,该等位基因改变了蛋白质664-847位氨基酸序列,影响了六个锌指C2H2型结构域,这些结构域对PRDM9蛋白的DNA结合功能至关重要。已知Prdm9基因在减数分裂过程中决定重组热点的位置,其敲除会导致精子发生失败。这一TR等位基因很可能是PL/J品系精子异常的重要遗传因素。
在NZB品系中,研究团队在Cacna2d3基因中发现了一个独特的TR等位基因,该等位基因改变了蛋白质25-264位氨基酸,位于高度保守的区域。Cacna2d3编码电压门控钙通道的辅助亚基,在大脑中广泛表达,调节神经递质释放和突触形成。人类遗传学研究已发现CACNA2D3与自闭症谱系障碍(ASD)相关,而Cacna2d3条件性敲除小鼠表现出ASD关键行为。NZB小鼠表现出的逆反学习缺陷和增强的空间记忆,与Cacna2d3功能受损的表型高度一致。
研究结论与意义
这项研究构建了首个全面的近交系小鼠串联重复序列图谱,揭示了小鼠TRs的基本特征、分布规律和进化模式。研究发现的小鼠与人类TRs的物种差异(如缺乏大规模重复扩展),为理解TRs在疾病发生中的种特异性提供了新视角。更重要的是,研究通过解析两个长期未解的表型,证明了TR等位基因在复杂性状遗传基础中的重要作用,为解答"缺失遗传力"问题提供了新思路。
研究人员指出,尽管这项研究取得了重要进展,但仍存在一定局限性。基于参考基因组的分析方法可能漏检高度 divergent 的TRs;大多数TRs位于内含子或基因间区,其功能影响难以直接预测。未来需要开发新的计算工具来预测TRs的功能影响,并通过实验验证其对基因表达和染色质结构的调控作用。
该TR图谱数据库已公开存放于Zenodo平台,长读长测序数据存放于NCBI BioProject数据库,为全球科研人员提供了宝贵资源。这项工作为后续研究TRs在基因组稳定性、进化和表型形成中的作用奠定了基础,对推进基础生物学研究和转化医学具有重要意义。随着对TRs功能理解的深入,科学家将能更全面地解析遗传变异的贡献,为复杂疾病的机制研究和治疗策略开发提供新线索。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号