T 细胞受体组库、CyTOF、基因分型及症状学数据整合揭示 COVID-19 患者的亚表型变异

【字体: 时间:2025年05月15日 来源:Computational and Structural Biotechnology Journal 4.5

编辑推荐:

  为揭示 COVID-19 临床结局差异机制,研究人员整合 CyTOF、TCRseq、ACE2 等基因 SNPs 及症状数据,对 61 例患者行 LCM-BIC 聚类。发现 3 个新亚群,其中 Cluster 1 富集重症,具独特免疫特征,为 COVID-19 分层管理提供新方向。

  

论文解读


研究背景与意义


新冠病毒(SARS-CoV-2)感染引发的 COVID-19 临床表现差异极大,从无症状到重症甚至死亡。尽管已有研究提出 LDH、CRP、IL-6 等血清标志物,以及 TMPRSS2、ACE2、MX1 等基因的遗传和表达分析,但这些标志物特异性不足,且仅覆盖疾病复杂进程的一小部分。深入理解免疫应答机制,尤其是整合免疫表型、遗传背景和临床数据的患者分层研究,对精准诊疗至关重要。

目前,免疫表型分析中,质谱流式细胞术(CyTOF)可详细研究先天免疫细胞如单核细胞 - 巨噬细胞谱系的变化,而 T 细胞受体测序(TCRseq)能通过分析互补决定区 3(CDR3)序列揭示适应性免疫中 T 细胞对病毒抗原的识别。然而,将 CyTOF、TCRseq 数据与症状学、基因分型整合用于 COVID-19 患者分层的研究尚有限。潜类别模型(LCM)因其对混合数据的鲁棒性和亚群检测能力,为解决这一问题提供了新途径。

西班牙研究人员针对这一现状,开展了相关研究,旨在通过多维度数据整合,识别 COVID-19 患者的新型免疫表型和遗传模式,为临床分层和管理提供依据。该研究成果发表在《Computational and Structural Biotechnology Journal》,为 COVID-19 的精准医学研究提供了重要参考。

主要技术方法


研究纳入 61 例西班牙 COVID-19 康复患者(33 例轻症、28 例重症),采集其血液样本,获取多维度数据:

  • 免疫表型数据:通过 CyTOF 检测 37 个免疫细胞群体,包括 32 个单核细胞亚群。
  • T 细胞受体组库数据:利用 MiXCR、VDJtools、Immunarch 等工具分析 TCR 序列,获取多样性、克隆性、V/J 等位基因频率等指标,并通过 GLIPH2 算法聚类 CDR3b 序列。
  • 症状学数据:记录发热、呼吸困难、嗅觉丧失等 10 项症状的有无。
  • 基因分型数据:对 ACE2(rs2285666)、MX1(rs469390)、TMPRSS2(rs2070788)3 个 SNPs 进行基因分型。

采用基于贝叶斯信息准则的潜类别模型(LCM-BIC)进行无监督聚类,并结合深度学习(DeepTCR)分析 CDR3 氨基酸序列,识别与疾病严重程度相关的特征。

研究结果


  1. LCM-BIC 聚类识别 3 个患者亚群
    通过 LCM-BIC 算法整合 143 个变量(129 个定量、13 个定性),将患者分为 3 个亚群(Cluster 1:20 例,Cluster 2:28 例,Cluster 3:13 例)。其中,Cluster 1 显著富集重症患者(p=0.009),其 T 细胞受体多样性较低、克隆性较高,且存在独特的 V 等位基因(如 TRBV6-3、TRBV12-3)和 GLIPH2 基序(如 SYGGE_4_22、S% GGE-FIY)。Cluster 2 以轻症为主,单核细胞亚群如 CM-CD36+、TM-CD36 + 水平较高。Cluster 3 的症状严重程度分布较均衡。

  2. 深度学习分析 CDR3 序列
    利用 DeepTCR 对 CDR3b 氨基酸序列进行分析,发现 Cluster 1 的 CDR3 序列在中央位置(5、6、7 位)富集谷氨酸(E)、天冬氨酸(D)、脯氨酸(P)等残基,可显著区分于 Cluster 2 和 3(AUC 分别为 0.645 和 0.796)。进一步筛选出 59 条与 SARS-CoV-2 反应的高预测性 CDR3b 序列,其保守残基位于 CDR3 的关键中心区域,提示与病毒抗原结合的特异性相关。

  3. 亚群间免疫特征与遗传背景差异
    Cluster 1 的非经典单核细胞和过渡型单核细胞减少,而 Cluster 2 的此类细胞水平较高,与既往重症患者单核细胞亚群变化的报道一致。基因分型数据显示,TMPRSS2(rs2070788)基因型在亚群间无显著差异,但 ACE2 和 MX1 的遗传变异可能与免疫特征存在潜在关联。


研究结论与讨论


本研究通过整合 CyTOF、TCRseq、症状学和基因分型数据,利用 LCM-BIC 成功识别出 3 个 COVID-19 患者亚群,其中 Cluster 1 的重症富集与独特的免疫表型(低 TCR 多样性、特定单核细胞亚群变化)和 CDR3 序列特征密切相关。深度学习进一步揭示了与疾病严重程度相关的 SARS-CoV-2 特异性 TCR 序列及其保守残基,为 T 细胞免疫应答机制提供了新见解。

研究结果表明,多维度数据整合结合机器学习方法可有效识别新型免疫标志物,为 COVID-19 患者的个性化分层和治疗策略制定提供了依据。尽管样本量较小可能影响模型的普适性,但所发现的 CDR3 序列特征和亚群特异性免疫模式为后续大样本验证和临床应用奠定了基础。未来研究可进一步扩大队列,结合单细胞技术和功能验证,深入解析这些标志物在病毒清除和病理过程中的作用,推动 COVID-19 精准医学的发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号