人类免疫球蛋白重链恒定区基因座的结构变异与编码多态性及其人群差异研究
《Cell Genomics》:The human IG heavy chain constant gene locus is enriched for large structural variants and coding polymorphisms that vary among human populations
【字体:
大
中
小
】
时间:2025年10月28日
来源:Cell Genomics 9
编辑推荐:
本研究针对人类免疫球蛋白重链恒定区(IGHC)基因多样性研究不足的问题,采用靶向长读长测序技术对105名不同祖先个体进行IGHC单倍型分析。结果发现7个大型结构变异(SV)和221个等位基因(其中192个为新发现),这些变异在不同人群中出现频率差异显著,且富含可能影响抗体效应功能的非同义替换。该研究为理解IGHC种系变异在抗体功能和疾病中的作用提供了新基础。
在我们身体的免疫防御系统中,抗体扮演着关键角色,它们是B淋巴细胞产生的蛋白质,能够识别并中和病原体。抗体的"重链"部分由免疫球蛋白重链恒定区(IGHC)基因编码,这些基因决定了抗体的类型(如IgG、IgA等),并直接影响抗体如何与免疫细胞相互作用,清除病原体。尽管IGHC基因如此重要,但科学家们对其在人类基因组中的多样性了解仍然有限。
传统的短读长测序技术在研究IGHC这类复杂基因区域时面临巨大挑战。该区域富含大量的片段重复和结构变异,使得准确解析基因序列变得异常困难。目前国际通用的参考基因组仅代表西方欧洲祖先个体的序列,这无疑限制了我们全面理解全球不同人群中的IGHC多样性。随着研究进展,科学家们逐渐意识到,IGHC基因的变异可能影响个体对感染的易感性、疫苗反应效率,甚至与自身免疫疾病和COVID-19严重程度等相关。
为了突破这一研究瓶颈,由Uddalok Jana、Oscar L. Rodriguez和Corey T. Watson等研究人员组成的团队在《Cell Genomics》上发表了最新研究成果。他们采用创新的靶向长读长测序技术,对来自五大超级种群(非洲、混合美洲、欧洲、东亚和南亚)的105名个体进行了深入的IGHC基因分析,构建了迄今为止最全面的IGHC变异图谱。
关键技术方法包括:利用太平洋生物科学公司的单分子实时测序技术,结合靶向捕获和fosmid克隆测序策略,对IGHC区域进行单倍型分辨率组装;使用Hifiasm和IGenotyper等生物信息学工具进行序列组装和变异检测;通过主成分分析和FST统计方法评估种群间遗传分化;建立等位基因注释流程对新发现的基因变异进行功能预测。
研究人员首先从代表不同遗传背景的个体中构建了高质量的单倍型分辨率组装。通过结合fosmid克隆测序和靶向长读长测序数据,他们成功构建了8个完整的单倍型组装,涵盖了非洲、东亚和欧洲人群的代表性个体。这些经过严格验证的组装为后续分析提供了可靠的基准数据集。验证显示,超过99.9%的组装碱基得到了测序读长的支持,确保了数据的准确性。
研究团队系统比较了两种组装策略(IGenotyper和Hifiasm)在二倍体样本中的表现。结果表明,Hifiasm能够产生更长的连续序列,平均contig长度达到114.8 kb,但在部分样本中出现了相位切换错误。在结构变异检测方面,Hifiasm显示出更高的准确性,能够正确识别倒位和IGHG4拷贝数变异等复杂变异。单核苷酸变异(SNV)基因型分析的总体一致率超过99%,证明了该方法在IGHC区域的可靠性。
研究发现了7个大型结构变异,其中包括一个约120 kb的插入变异,该变异包含了IGHE、IGHG4、IGHG2和IGHA1基因的额外拷贝。此外,还鉴定出IGHG4基因的串联三重复制、完全缺失等罕见变异。通过对IGHG4区域的单倍型聚类分析,研究人员识别出23个不同的单倍型集群,这些集群在人群中的分布频率存在显著差异。例如,某些单倍型集群在非洲人群中更为常见,而另一些则在东亚人群中富集。
研究共鉴定出221个IGHC等位基因,其中192个(87%)为首次发现的新等位基因。这些新等位基因在所有9个功能性IGHC基因中均有发现,且在非洲血统个体中更为丰富(平均每人携带12个新等位基因)。重要的是,许多新等位基因携带已知功能位点的氨基酸替换,可能影响Fc受体结合、抗体依赖性细胞毒性(ADCC)和抗体半衰期等关键功能。例如,IGHG3等位基因在16个不同功能位点存在氨基酸替换,这些位点已知会影响Fc-FcγR相互作用。
主成分分析显示,IGHC区域的遗传变异能够有效区分不同人群,特别是非洲和东亚人群表现出明显的遗传分化。研究人员发现了数百个具有高种群分化指数(FST > 0.3)的SNV位点,这些位点主要集中在IGHG1和IGHG3基因区域。结构变异的频率也在人群间存在显著差异,如倒位变异在非洲人群中完全不存在多态性,而IGHG4拷贝数在东亚人群中明显较低。
尽管本研究取得了重要突破,但作者也指出了若干局限性。样本规模相对较小,需要在更大群体中验证这些发现。此外,当前的分析工具在处理复杂基因区域时仍需进一步优化。未来的研究应着重于解析这些遗传变异如何影响抗体 repertoire 组成和效应功能,以及它们在疾病易感性和治疗反应中的作用。
这项研究为我们理解人类免疫系统的遗传基础提供了重要见解。通过揭示IGHC基因座中前所未见的多样性,研究人员为未来研究抗体功能、疫苗开发和疾病机制建立了新的基础。随着长读长测序技术的不断进步和更多人群数据的积累,我们有望更全面地理解免疫球蛋白基因多样性在人类健康和疾病中的重要作用,最终推动个性化免疫治疗的发展。
该研究强调,构建更具代表性的泛基因组参考资源对于准确表征IGHC等复杂基因区域的遗传变异至关重要。这种全面的遗传视角将有助于揭示种群特异性免疫特征,为全球健康公平性和精准医学的实现提供科学依据。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号