人类TCR-HLA交叉反应性的大规模定量研究揭示自身免疫风险预测与移植优化新机制

《SCIENCE ADVANCES》:Quantitative and large-scale investigation of human TCR-HLA cross-reactivity

【字体: 时间:2025年10月27日 来源:SCIENCE ADVANCES 12.5

编辑推荐:

  本研究针对T细胞受体(TCR)与人类白细胞抗原(HLA)交叉反应性机制不清的问题,开发了TCR-based HLA相似性网络THNet。基于900多万个显著关联的HLA-TCR对,构建了HLA等位基因的功能相似性网络,揭示了肽段交叉呈递对HLA-TCR交叉反应性的贡献。研究发现可识别单HLA富集分析遗漏的疾病易感性,尤其在黑种人群体中,并证明THNet能在不同移植情境中优先选择最佳HLA错配候选,为供体选择策略提供新工具。该研究为自身免疫风险预测和改善移植结局提供了新见解。

  
在人体免疫系统的精密防御网络中,T细胞扮演着关键角色,它们通过表面的T细胞受体(T cell receptor, TCR)识别由人类白细胞抗原(human leukocyte antigen, HLA)分子呈递的肽段,从而启动特异性免疫应答。然而,这种识别并非严格的一对一关系,而呈现出复杂的多对多模式——单个TCR能够识别多种肽段-HLA复合物,反之,同一肽段-HLA复合物也能激活不同的T细胞克隆。这种被称为TCR交叉反应性的现象,确保了有限的TCR库能够应对无限多样的潜在病原体,但同时也带来了自身免疫疾病和移植排斥的风险。
尽管早期研究提示单个TCR平均可与超过106种不同的pHLA复合物结合,且约45%的病毒特异性记忆CD4+和CD8+ T细胞能够与至少一种异体HLA分子发生交叉反应,但由于实验技术限制,对不同HLA等位基因间TCR交叉反应性的全貌仍知之甚少。传统的序列或结构相似性方法难以准确捕捉HLA分子的功能等效性,而基于肽段结合谱的MHCcluster方法又未能充分考虑HLA变异对TCR库的塑造作用。这些局限性促使研究人员开展大规模定量研究,以揭示TCR-HLA交叉反应性的程度和机制。
为解决这一挑战,研究团队在《SCIENCE ADVANCES》上发表了题为"Quantitative and large-scale investigation of human TCR-HLA cross-reactivity"的研究。他们开发了THNet框架,通过整合5个包含高分辨率HLA分型的TCR数据库,共1603个样本(其中1405个具有完整的I类和II类HLA数据),从中筛选出46,963,799条TCRβ链序列。利用几何同构为基础的TCR比对算法GIANA进行超快速聚类,识别出456,315个TCR簇,进而通过富集分析发现了9,125,142个显著的TCR-HLA关联对,构建了迄今为止最大规模的TCR-HLA交互图谱。
关键技术方法包括:1) 从多个公共数据库整合1603份具有高分辨率HLA分型的TCR样本;2) 使用GIANA算法对超过4700万条TCRβ链进行超快速聚类;3) 基于TCR簇的富集分析识别HLA关联TCR;4) 构建HLA功能相似性网络并开发HLA分型推断模型;5) 利用英国生物样本库(UK Biobank)和移植登记数据库(SRTR/CIBMTR)进行疾病关联和移植预后分析。
The THNet框架
研究人员首先建立了THNet计算框架,通过对TCR序列进行聚类和富集分析,构建了基于TCR的HLA相似性网络。该框架能够从高通量批量TCRβ测序数据中预测样本HLA分型,在不牺牲准确性的前提下实现了广泛的HLA等位基因覆盖。更重要的是,THNet可用于人群聚类分析,并评估不同移植类型中供体-受体对的HLA错配耐受性。
Identification of HA TCR clusters
研究发现大多数HLA关联TCR与多个等位基因相关,显示出高度的TCR-HLA交叉反应性。具体而言,只有44.3%的I类和37.3%的II类HLA关联TCR富集在单个HLA等位基因上,而17.4%的I类和17.0%的II类HLA关联TCR富集在超过四个HLA等位基因上。跨I类和II类HLA等位基因的TCR富集远不如同一HLA类别内的交叉反应性常见,这与CD8+(I类)和CD4+(II类)T细胞不同的成熟路径一致。
Reproducible HLA typing inference from TCR repertoire
研究人员为每个HLA等位基因构建了L1正则化逻辑回归模型,使用相应的HLA关联TCR作为输入特征来预测个体是否携带特定等位基因。大多数HLA等位基因在未见样本上表现出强大的预测能力,I类等位基因的中位曲线下面积(area under the curve, AUC)为0.76,II类等位基因的中位AUC为0.87。在独立验证队列中,THNet实现了比现有最先进模型HLAGuessr更高的敏感性和更广的HLA覆盖范围。
TCR-based HLA similarity network
通过Hausdorff距离度量构建的HLA相似性网络显示,I类HLA等位基因彼此间的交叉反应性高于II类HLA等位基因。I类HLA等位基因间的平均距离为0.72,而II类HLAα链和β链的平均距离分别为0.79和0.83。有趣的是,组内等位基因对(相同两位数组)和组间等位基因对(不同两位数组)在所有I类和II类位点上显示出基本相当的距离,表明基于序列相似性的两位数组分组可能无法转化为TCR库水平的功能相似性。
HLA-based population clustering and disease association
利用HLA相似性网络,研究人员基于I类和II类HLA基因型将人群聚类为不同的功能组。在英国生物样本库中,这种方法识别出了所有测试人群中I类和II类HLA簇的显著疾病关联。特别是在黑种人群体中,HLA簇方法比单等位基因富集分析识别出更多显著的HLA-疾病关联,这可能与非裔个体中较短的连锁不平衡区块有关。
HLA mismatch score as an indicator of transplantation outcome
研究将THNet应用于移植领域,开发了错配评分(mismatch score, MS)来量化供体-受体对的HLA距离。在肾脏移植中,THNet I类MS对移植肾衰竭的预测能力优于表位(eplet)评分,而II类的情况则相反。将THNet I类MS和表位II类评分结合后,提供了最佳的患者分层效果。在肝脏和肺移植中,THNet I类MS也显示出比表位评分更好的预测能力,而在造血干细胞移植中,THNet II类MS是比II类表位评分更好的移植排斥预测指标。
研究结论表明,通过大规模调查HLA交叉反应性,THNet框架成功量化了不同HLA等位基因间的共享TCR库,定义了HLA相似性网络。这一网络不仅揭示了独特的HLA疾病易感性,还将HLA距离定义的错配评分作为移植排斥的预测指标。研究的创新之处在于从功能性TCR输出的角度定义HLA相似性,而非传统的序列或结构特征,为理解免疫交叉反应性提供了新视角。
讨论部分指出,不同距离度量标准突出了TCR库相似性的不同方面,可能在不同应用场景中具有优势。Hausdorff度量强调HLA等位基因间的分歧程度,使其特别适用于预测移植结局等应用;而Jaccard指数关注TCR库的重叠部分,可能更适用于捕获HLA等位基因间共享的疾病关联。值得注意的是,在器官移植和造血干细胞移植中,I类和II类THNet错配评分表现出不同的性能特征,这很可能反映了不同移植类型中排斥机制的差异。
该研究的局限性包括可预测HLA等位基因的数量仍然有限,罕见等位基因的准确性受到阳性样本数量的限制,以及使用批量TCRβ链测序数据而缺乏配对的α链信息。未来的研究方向包括扩展具有高分辨率HLA基因型的TCR数据集,以及利用单细胞TCR测序技术来更完整地表征TCR-HLA相互作用。
总之,这项研究通过对TCR-HLA功能关系的深入探索,增强了我们对免疫交叉反应性的理解,为疾病易感性和移植排斥的机制提供了新的见解。THNet框架有望通过阐明HLA等位基因在塑造临床结局中的作用,推动精准医疗的发展,特别是在自身免疫风险预测和移植优化策略方面具有重要应用价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号