
-
生物通官微
陪你抓住生命科技
跳动的脉搏
CACNA1C基因内含子3可变数目串联重复序列(VNTR)多态性结构与精神分裂症风险的关联研究
【字体: 大 中 小 】 时间:2025年09月12日 来源:Proceedings of the National Academy of Sciences 9.4
编辑推荐:
本研究利用长读长基因组组装技术,首次系统解析了CACNA1C基因内含子3可变数目串联重复序列(VNTR)的结构多态性,发现其7种结构类型(Types)与精神分裂症(GWAS)风险信号存在完全连锁不平衡(LD),且风险单倍型与脑组织中CACNA1C表达下调显著相关,为神经精神疾病遗传机制提供了重要见解。
研究团队利用来自人类基因组结构变异联盟(HGSVC2)、人类泛基因组参考联盟(HPRC)和端粒到端粒(T2T)项目的155个长读长单倍型组装数据,对CACNA1C基因内含子3的可变数目串联重复序列(VNTR)进行了全面解析。通过多序列比对和重复单元聚类分析,他们识别出34,172个重复单元,其中35个高频单元(频率>5×10?4)占序列总量的98%以上。共识重复单元(出现频率32%)与其他单元平均存在2.3个核苷酸差异。基于序列差异,155条VNTR序列被划分为7种结构类型(Types),其中Type 1占比88%,中位长度5.7 kb;Type 2和3长度增加30-40%(中位8.3-8.4 kb);Type 4长度一致(7.2 kb);Type 5长度变异最大(13-61 kb);Type 6和7各由单一独特序列定义。每种类型均得到PacBio HiFi组装数据支持,且测序覆盖深度分析证实了组装准确性。
通过滑动窗口(宽度6个重复单元)比对分析,发现Type 2和3相对于Type 1存在千碱基规模的串联重复(Duplication 1和2)。Type 2的重复断点存在变异,而Type 3的断点完全一致。此外,在Types 1-3中还发现两个较小重复(Duplication 4:420 bp,非完全串联;Duplication 5:300 bp,与可变区VR1部分重叠)。Type 5序列表现出高度异质性,存在多重千碱基规模重复段,且不同序列间结构复杂(如大片段缺失、重复等)。对Type 1序列的变异性扫描揭示了26个对齐缺口,其中24个对应串联重复事件(共102次,平均每条序列0.76次),多数为无差异重复。靠近VNTR末端的两个缺口不符合串联重复模型,提示可能存在其他突变机制。
在Type 1序列中,两个高变区域(Variable Region 1, VR1 和 VR2)被详细解析。VR1的18条 distinct序列被分为两个等位基因:VR1A(频率64%)和VR1B,两者相差11个重复单元(330 bp),提示 ancestral扩张或截断。VR2的71条 distinct序列被分为四个等位基因(VR2A, VR2B, VR2C, VR2D),其重复单元组成和顺序差异导致显著核苷酸水平差异。VR1与VR2存在高强度连锁不平衡(R2=0.85):VR1A与VR2A/C/D共存,VR1B与VR2B共存。未分类的VR1/VR2序列共同出现于相同组装中。
CACNA1C内含子3区域在胎儿脑组织(Roadmap Epigenomics)和谷氨酸能神经元(scATAC-seq)中呈现DNaseI超敏感位点(DHSs)。GTEx项目数据显示该区域存在脑组织eQTLs(小脑、小脑半球、壳核、黑质)。利用35个HGSVC2个体的分型数据,分析显示VR2与精神分裂症 fine-mapped SNPs存在极高LD(三个SNPs与VR2完全连锁,R2=1.0),而VR1关联性较弱。欧洲裔亚群分析显示类似模式。eQTL分析揭示两个独立信号:一个与精神分裂症和VR2关联,另一个则无。VR2 LD程度与eQTL显著性高度相关(R2=0.531, P<2.2×10–16)。与VR2连锁的eQTLs平均等位基因折叠变化(aFC)为-0.998,意味着风险等位基因导致CACNA1C表达量下降约2倍。
不同类型VNTR的 ancestry分布差异显著:Type 1反映整体 ancestry组成;Type 2富集于非洲裔,Type 3富集于亚洲裔;Types 4-7几乎仅见于非洲裔个体。VR2等位基因频率也存在 ancestry偏好:VR2B和VR2D在非洲裔中更常见,VR2C在东亚裔中更常见,VR2B在南亚裔中更常见。未分类VR2序列均为非洲裔。重复单元频率分析显示,29个最丰富单元 ancestry分布与数据集一致,129个低频单元(频率<0.0011)主要见于非洲裔序列或单一序列。与非人灵长类(黑猩猩、大猩猩)对比证实该VNTR为人类特有,其共识重复单元在第17位点(G)与黑猩猩序列(A)存在固定差异。对四个古人类基因组(尼安德特人、丹尼索瓦人,距今约52-122千年)的测序覆盖深度分析表明,其VNTR长度(3.36-10.56 kb)与现代人类似,提示该重复的扩张发生在现代人与古人类分化之前(约63-52万年前)。
本研究通过长读长技术揭示了CACNA1C VNTR的复杂结构多样性,包括重复单元变异、类型分化、内部重复和多态性可变区。罕见重复单元和超长序列多见于非洲裔个体,而不同规模的串联重复广泛存在。最常见结构(Type 1)中的可变区定义了 distinct等位基因并在人群中分布。精神分裂症关联和脑eQTLs均与VNTR变异紧密连锁,支持常见变异通过调控CACNA1C表达影响疾病风险的模型。尽管VR2被重点 implicating,但其 exact功能机制(如是否作为内源增强子)及与邻近DHSs的互作需进一步研究。关于风险变异对CaV1.2通道功能的 directionality,现有证据提示小脑中表达下调,但其他脑区(如前额叶皮层)报告了相反关联,可能反映了细胞类型特异性效应。技术层面,长读长组装的高精度(PacBio HiFi错误率<10–5)、单倍型分型准确性( trio传输验证)及序列唯一性(无 identical alleles)保障了分析可靠性。VNTR的扩张机制可能与近着丝粒/端粒区域的高重组率和不平等交换有关,其巨大结构多样性(长度和重复单元变异度均居已知人类特异VNTR前列)为研究 subtelomeric基因家族的进化适应提供了范例。本研究为复杂GWAS位点的精细解析建立了模板,但后续仍需在疾病队列和 relevant细胞类型中验证候选因果变异的功能。
生物通微信公众号
知名企业招聘