
-
生物通官微
陪你抓住生命科技
跳动的脉搏
线粒体基因组测序揭示食管癌致病性变异与保护性单倍群D4的作用机制研究
【字体: 大 中 小 】 时间:2025年09月23日 来源:Frontiers in Genetics 2.8
编辑推荐:
本研究通过新一代测序技术(NGS)分析146例食管癌(EC)患者和120例健康对照的线粒体全基因组,发现EC群体存在1299个变异(含171个新发突变),鉴定出3个可能致病的tRNA变异(7496_T>C、5771_A>G、5613_T>A)及14个蛋白编码区有害变异,并首次揭示单倍群D4及其特异性SNPs(如8414_C>T和14668_C>T)可显著降低EC发病风险,为食管癌的遗传机制研究和早期筛查提供了新的分子标志物。
1 Introduction
线粒体作为关键的细胞器,通过氧化磷酸化(OXPHOS)产生能量并调控细胞凋亡、钙稳态及代谢信号传导。其基因组(mtDNA)全长16,569 bp,包含13个OXPHOS相关蛋白编码基因、22个tRNA基因和2个rRNA基因,以及一个调控转录与复制的控制区(CR)。mtDNA易受致癌物影响,突变频率较核DNA高10-20倍,可能导致线粒体功能障碍并参与癌症发生。食管癌(EC)作为高致死性消化道肿瘤,其遗传易感性是重要风险因素,而针对胚系mtDNA变异的研究仍相对有限。既往研究多聚焦于高变区(HVR1),缺乏全基因组层面的分析。单倍群作为mtDNA变异的分类体系,与多种癌症风险相关,但其在EC中的作用尚存争议。本研究旨在通过全基因组测序,揭示四川北部EC高发区人群的mtDNA变异分布、致病性及单倍群关联。
2 Materials and methods
2.1 Sample collection and DNA extraction
研究纳入146例EC患者和120例健康对照,均来自四川北部高发区。采集外周血样本并使用EDTA抗凝管保存,通过天根血液基因组DNA提取试剂盒提取DNA。本研究经川北医学院伦理委员会批准(NSMC [2022] 08和NSMC [2024] 026),所有参与者均签署知情同意书。
2.2 mtDNA amplification, template preparation, and sequencing
使用RealCap? Human ChrMT Kit进行文库构建,通过多重PCR扩增目标区域,并在Illumina Novaseq6000平台上进行双端150 bp测序。
2.3 Sequencing data processing
使用fastp过滤低质量读数,BWA将序列比对至人类mtDNA参考序列(rCRS, NC_012920),并通过SAMtools和BCFtools检测变异位点及生成一致序列FASTA文件。
2.4 Variant annotation and pathogenicity prediction
变异注释依托MitoMap数据库,新变异定义为未收录于该库的突变。利用44种灵长类基因组评估进化保守性(CI > 75%视为高保守)。tRNA变异致病性通过MitoTip评分评估:>16.25为可能致病(LP),12.66–16.25为潜在致病(PP)。蛋白编码区变异则通过13种生物信息学工具(如PolyPhen2、SIFT、CADD等)预测,超过半数工具判定为有害则视为致病。
2.5 Determining heteroplasmic and homoplasmic variants
通过计算变异等位基因比例(HF)区分异质性(HF 1%–98%)和同质性(HF ≥ 98%),HF < 1%的变异被排除。
2.6 mtDNA haplogroups and SNPs
使用Haplogrep3平台基于PhyloTree 17进行单倍群分类,并筛选等位基因频率(MAF)≥ 5%的SNPs进行分析。
2.7 Population comparisons
获取潮汕地区119例及中国21个省份9209例mtDNA基因组数据,通过主成分分析(PCA)比较遗传关系。
2.8 Statistical analyses
采用Mann-Whitney U检验、卡方检验、Fisher精确检验和逻辑回归进行统计分析,显著性阈值设为P < 0.05。
3 Results
3.1 Distribution of mtDNA variations
在146例EC患者中共鉴定1299个变异,涉及1234个位点,其中D-loop和rRNA区变异数量最多。新变异占171个,包括19个非同义突变和10个移码突变。罕见变异(AF < 0.5%)占比72.5%。单碱基替换(如T>C、C>T)为主要变异类型,其中颠换较转换更易引发氨基酸改变。ATPase6、CYTB和ND5基因的非同义变异比例较高。EC组个体平均变异数(53.5)高于对照组(41.07),但无显著差异。EC组在ND2、COX1、COX2、12S rRNA和16S rRNA区域的变异数量显著多于对照组,编码区平均变异数亦更高(9.25 vs. 7.08, P = 1.55E?4)。
3.2 The level of heteroplasmy in mtDNA variations
共识别1298个mtDNA变异,其中异质性占45.2%,同质性占37.4%,其余为混合状态。插入/缺失(indel)在异质性变异中更常见(P = 6.43e?18),且多分布于非编码区和rRNA区。EC组异质性变异平均数量(34.78)显著高于对照组(10.97, P = 0.0394),且在ND2、ND4、ND6、COX1、COX2、12S rRNA和16S rRNA区域富集。
3.3 Pathogenicity prediction of mtDNA variations
在RNA编码区鉴定60个12S rRNA、199个16S rRNA和67个tRNA变异。基于频率和保守性筛选出14个tRNA变异,其中3个(5613_T>A、5771_A>G、7496_T>C)经MitoTip预测为可能致病,分别位于tRNA-Ala、tRNA-Cys和tRNA-Ser基因。7496_T>C此前已被报道与听力损失相关。蛋白编码区发现502个同义、212个非同义和10个移码变异,其中55个非同义变异经13种工具评估后,14个被超过半数程序判定为有害,包括11622_A>G(全部工具预测为致病)。这些变异分布于ND4、ND5、CYTB、ATP6、ATP8和COX3基因。
3.4 Association between mtDNA haplogroups and SNPs and EC risk in northern Sichuan population
单倍群分析显示,D4在对照组中频率(19.17%)显著高于EC组(9.59%),其携带者EC风险降低(OR = 0.447, P = 0.032)。筛选出的101个常见SNPs中,6个(302_A>AC、1824_T>C、1842_A>G、3010_G>A、8414_C>T、14668_C>T)与EC风险显著相关,其中8414_C>T和14668_C>T为D4特异性SNPs,进一步支持D4的保护作用。
3.5 Genetic relationship between Northern Sichuan EC high-incidence people with other populations
PCA分析显示,四川北部人群与云南、贵州(中国西南)人群遗传关系较近,而潮汕高发区人群则与福建、台湾(东南)人群聚类,表明两地EC高发人群无密切遗传关联。
4 Discussion
本研究首次在四川北部EC高发区完成线粒体全基因组测序,发现EC患者mtDNA变异数量及异质性水平均高于健康对照,且D-loop和rRNA区为突变热点。ND2、COX1、COX2等基因的变异富集提示OXPHOS功能障碍可能通过ROS积累和代谢重编程促进EC发展。异质性变异的高频出现表明其可作为EC潜在生物标志物。致病性变异预测揭示tRNA和蛋白编码区(如ND4、CYTB、ATP6)的突变可能通过破坏电子传递链功能、诱发氧化应激及能量代谢失衡驱动肿瘤发生。保护性单倍群D4的发现为EC遗传易感性提供了新视角,其与潮汕地区研究结果的差异可能源于人群遗传背景不同。本研究填补了地区性mtDNA数据库空白,为EC的机制研究、风险分层和早期干预提供了重要依据。局限性包括未评估环境与基因交互作用、工具预测偏倚及缺乏功能验证,后续需结合多组学分析和实验验证深化研究。
生物通微信公众号
知名企业招聘