HLA数据分析新工具:HLAtools与SSHAARP的全球变异可视化及计算资源创新

【字体: 时间:2025年09月16日 来源:International Journal of Immunogenetics 1.1

编辑推荐:

  这篇综述推荐:本文系统介绍了HLAtools(R包)、SSHAARP(共享HLA氨基酸残基频率分析工具)和全球频率浏览器(GFB)三大创新工具,通过标准化计算框架将静态HLA数据转化为可交互资源,支持等位基因、单倍型和氨基酸基序的全球频率热图生成,为感染性疾病、自身免疫病、肿瘤及移植免疫研究提供高效分析平台。

  

摘要

HLA基因作为人类基因组中多态性最高的区域(6p21.3),其变异与感染性疾病易感性、自身免疫病、肿瘤及移植治疗密切相关。目前IPD-IMGT/HLA数据库已收录超41,000个等位基因,但静态数据格式限制了其应用潜力。HLAtools R包通过构建可计算数据集(如HLAatlas、HLAgazetteer)和72种功能函数,实现了对HLA基因结构、伪基因特征及序列变异的自动化查询与分析。例如,fragmentFeatureNames数据集首次系统标注了HLA-DPA2、HLA-R等伪基因的非标准外显子-内含子边界,而HLAalignments支持多序列比对的自定义检索。

方法学创新

SSHAARP R包通过PALM()函数生成等位基因(如HLA-B27:02)、单倍型(A26:01~C*03:03)及氨基酸基序(如DRβ-86G/V)的全球频率热图,其底层数据整合了Solberg等研究的66,830个体497个种群数据。值得注意的是,DRβ-86甘氨酸/缬氨酸多态性热图揭示了其在造血干细胞移植(HCT)配型中的地理差异:北美原住民DRβ-86G纯合子频率高达90%,而非洲人群杂合子占比50%,为临床供体选择提供空间流行病学依据。

工具应用场景

  1. 1.

    临床移植:HLAtools的verifyAllele()可验证供受体HLA命名一致性,而氨基酸基序热图(如DRB1 * 25R~38V~48R~127I)能识别功能性表位分布。

  2. 2.

    进化研究:GFB浏览器展示的DRB1 * 15:01高频集中于北欧,印证了病原体驱动的自然选择假说。

  3. 3.

    数据转换:updateGL()函数实现跨IPD-IMGT版本(如3.59.0→3.61.0)的等位基因名称转换,解决历史数据兼容性问题。

技术局限性

当前GFB仅涵盖805个高频HLA等位基因(占CIWD目录20%),未来需整合AFND等数据库扩展低频变异图谱。HLAtools的HLAalignments数据集(24.2 MB)需用户本地构建,对计算资源提出一定要求。

发展前景

作者计划将SSHAARP扩展至KIR、MHC-I链相关基因(MIC)的频率可视化,并引入序列特征变异类型(SFVT)分析框架。通过GitHub社区协作,这些工具将持续优化,推动免疫基因组学向精准医学迈进。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号