AnalyzAIRR:基于R语言的适应性免疫受体库分析工作流程及其在T细胞亚群研究中的应用

【字体: 时间:2025年06月26日 来源:ImmunoInformatics

编辑推荐:

  推荐:本研究针对适应性免疫受体库(AIRR)数据分析的复杂性,开发了用户友好的R包AnalyzAIRR,整合了先进的统计与可视化方法。通过分析18个小鼠T细胞受体(TCR)亚群数据,成功识别并去除污染克隆,揭示了不同T细胞亚群的多样性差异和基因使用特征。该工具通过Shiny界面降低了生物学家使用门槛,为免疫组学研究提供了标准化分析框架。

  

免疫系统的复杂性源于其通过B细胞受体(BCR)和T细胞受体(TCR)实现的抗原特异性识别能力,这些受体由IG或TR基因通过V(D)J重组形成,构成适应性免疫受体库(AIRR)。尽管高通量测序(HTS)技术使AIRR研究取得突破,但数据分析的复杂性成为非生物信息学背景研究者的主要障碍。现有工具如MiXCR、Immunarch等虽功能强大,但需要编程技能,限制了其广泛应用。

为突破这一瓶颈,研究人员开发了AnalyzAIRR——一个兼容AIRR社区标准的R软件包。该工具整合了多样性评估(如Rényi指数)、克隆频率分析和交叉样本比较等方法,并通过Shiny交互界面实现"无代码"操作。研究团队利用该工具分析了18个小鼠TCRα链数据集,包含效应T细胞(Teff)、初始调节T细胞(nTreg)和活化调节T细胞(amTreg)亚群。

关键技术包括:1) 基于MiXCR(v4.4.1)的序列注释;2) 使用Rényi熵和Chao1指数评估克隆多样性;3) 通过Jaccard和Morisita-Horn距离进行样本相似性分析;4) Shannon熵标准化方法消除测序深度差异;5) 差异基因表达分析鉴定T细胞亚群特征。

数据验证
通过rarefaction曲线和Chao1指数评估测序深度,发现Teff样本存在异常克隆扩增。Rényi曲线显示Teff样本多样性显著降低,频率相关性分析揭示这些样本共享高频污染克隆。通过V-J组合热图定位污染源后,成功过滤干扰数据。

样本标准化
比较两种标准化方法:随机降采样和基于Shannon熵的过滤。后者在保留样本特征的同时(Jaccard距离聚类一致),有效校正了小样本中克隆分布偏差,使跨样本比较成为可能。

基因使用分析
TRAV/TRAJ基因频率比较显示amTreg与nTreg存在显著差异。火山图鉴定出10个差异表达的V-J组合(|log2FC|≥2,p≤0.05),这些组合在MDS分析中能清晰区分两种Treg亚群。

克隆性与多样性
nTreg表现出最高多样性(Rényi曲线),amTreg最低。克隆数分析显示Teff与nTreg相似,但显著高于amTreg(p<0.001)。频率累积曲线证实amTreg中高频克隆比例显著增加。

库组成比较
Jaccard距离将amTreg与其他亚群分离,而Morisita-Horn指数(考虑克隆丰度)进一步区分所有亚群。值得注意的是,Teff样本相似性与小鼠性别相关,这为后续研究提供了线索。

该研究证实AnalyzAIRR能系统解决AIRR数据分析的三个核心需求:数据质量控制(如污染识别)、单样本探索(如多样性分析)和交叉样本比较(如亚群差异)。工具的创新性体现在:1) 整合生态学指标(如Hill数)量化免疫多样性;2) 开发Shannon熵标准化方法;3) 实现自动化报告生成。与现有工具相比,其优势在于将专业分析与用户友好界面结合,使生物学家能独立完成从原始数据到生物学解释的全流程。

研究揭示的T细胞亚群特征(如amTreg的低多样性)为理解调节性T细胞功能提供了新视角。未来工作可扩展至BCR分析和疫苗应答研究。AnalyzAIRR的开源特性(GPL-3许可)保障了工具的可扩展性,其模块化设计支持新算法的持续集成,有望成为免疫组学研究的标准化平台。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号