
-
生物通官微
陪你抓住生命科技
跳动的脉搏
HLA数据分析新工具:HLAtools与SSHAARP的全球变异可视化及计算资源创新
【字体: 大 中 小 】 时间:2025年09月16日 来源:International Journal of Immunogenetics 1.1
编辑推荐:
这篇综述推荐:本文系统介绍了HLAtools(R包)、SSHAARP(共享HLA氨基酸残基频率分析工具)和全球频率浏览器(GFB)三大创新工具,通过标准化计算框架将静态HLA数据转化为可交互资源,支持等位基因、单倍型和氨基酸基序的全球频率热图生成,为感染性疾病、自身免疫病、肿瘤及移植免疫研究提供高效分析平台。
HLA基因作为人类基因组中多态性最高的区域(6p21.3),其变异与感染性疾病易感性、自身免疫病、肿瘤及移植治疗密切相关。目前IPD-IMGT/HLA数据库已收录超41,000个等位基因,但静态数据格式限制了其应用潜力。HLAtools R包通过构建可计算数据集(如HLAatlas、HLAgazetteer)和72种功能函数,实现了对HLA基因结构、伪基因特征及序列变异的自动化查询与分析。例如,fragmentFeatureNames数据集首次系统标注了HLA-DPA2、HLA-R等伪基因的非标准外显子-内含子边界,而HLAalignments支持多序列比对的自定义检索。
SSHAARP R包通过PALM()函数生成等位基因(如HLA-B27:02)、单倍型(A26:01~C*03:03)及氨基酸基序(如DRβ-86G/V)的全球频率热图,其底层数据整合了Solberg等研究的66,830个体497个种群数据。值得注意的是,DRβ-86甘氨酸/缬氨酸多态性热图揭示了其在造血干细胞移植(HCT)配型中的地理差异:北美原住民DRβ-86G纯合子频率高达90%,而非洲人群杂合子占比50%,为临床供体选择提供空间流行病学依据。
临床移植:HLAtools的verifyAllele()可验证供受体HLA命名一致性,而氨基酸基序热图(如DRB1 * 25R~38V~48R~127I)能识别功能性表位分布。
进化研究:GFB浏览器展示的DRB1 * 15:01高频集中于北欧,印证了病原体驱动的自然选择假说。
数据转换:updateGL()函数实现跨IPD-IMGT版本(如3.59.0→3.61.0)的等位基因名称转换,解决历史数据兼容性问题。
当前GFB仅涵盖805个高频HLA等位基因(占CIWD目录20%),未来需整合AFND等数据库扩展低频变异图谱。HLAtools的HLAalignments数据集(24.2 MB)需用户本地构建,对计算资源提出一定要求。
作者计划将SSHAARP扩展至KIR、MHC-I链相关基因(MIC)的频率可视化,并引入序列特征变异类型(SFVT)分析框架。通过GitHub社区协作,这些工具将持续优化,推动免疫基因组学向精准医学迈进。
生物通微信公众号
知名企业招聘