SPAID:自身免疫性疾病中疾病特异性自身抗原综合数据库

《Advanced Biotechnology》:SPAID: a comprehensive database for disease-specific autoantigens in autoimmune disorders

【字体: 时间:2026年06月09日 来源:Advanced Biotechnology

编辑推荐:

  自身免疫性疾病(ADs)是以复杂病因和显著诊断挑战为特征的慢性炎症性疾病。尽管自身抗原对于精准诊断和治疗至关重要,但由于历史上研究重点主要集中于经典规范蛋白,免疫原性图谱中的大量内容仍未被探索。研究人员开发了 SPAID(https://spaid.renla

  
自身免疫性疾病(ADs)是以复杂病因和显著诊断挑战为特征的慢性炎症性疾病。尽管自身抗原对于精准诊断和治疗至关重要,但由于历史上研究重点主要集中于经典规范蛋白,免疫原性图谱中的大量内容仍未被探索。研究人员开发了 SPAID(https://spaid.renlab.cn),这是一个面向 14 种 ADs 的候选自身抗原发现综合资源,在双层证据框架中整合了规范蛋白和非规范蛋白。验证层(validated level)包含与经实验确认表位相关的蛋白,这些表位来源于 T 细胞检测和主要组织相容性复合体(MHC)配体检测。基于蛋白质组学的层级(proteomics-based level)包含通过人类样本质谱(MS)鉴定的蛋白,并进一步标注差异表达模式、免疫原性评分及功能特征,以支持候选自身抗原的发现和后续验证。通过结合验证证据与蛋白质组学证据,SPAID 能够全面刻画候选自身抗原谱,并促进对抗原来源及致病性识别机制的研究。总体而言,SPAID 为推进以抗原为中心的研究以及开发自身免疫相关新型诊断和治疗策略提供了基础性资源。
这篇发表于《Advanced Biotechnology》的论文围绕自身免疫性疾病(ADs)的核心病理环节展开,即机体对自身蛋白免疫耐受破坏后,持续产生针对内源性抗原的异常免疫应答。自身抗原既是致病反应启动和维持的关键分子,也是精准分型、早期诊断和靶向干预的重要基础。然而,既往研究与数据库大多聚焦于经典蛋白编码基因及已知抗原,缺乏对非规范蛋白的系统纳入,也缺少跨疾病、跨组织、以蛋白质组学证据为支撑的统一资源。随着研究发现非编码 RNA(ncRNA,非编码核糖核酸)及内含子区域也可翻译产生蛋白,这些非规范蛋白可能在炎症或免疫应激环境下异常表达,并作为新型免疫原性肽来源,因此有必要建立兼顾规范与非规范蛋白的候选自身抗原数据库。

研究人员据此构建了 SPAID,一个面向 14 种 ADs 的疾病中心化数据库平台。该平台以统一蛋白序列空间为参照框架,将证据组织为两个层级:其一为验证层,纳入具有实验免疫学支持的表位及对应蛋白;其二为基于蛋白质组学的层级,纳入来源于人类样本质谱(MS,质谱)鉴定的疾病相关肽段和蛋白,并叠加差异表达、免疫原性和功能结构注释。研究表明,SPAID 不仅系统扩展了自身免疫性疾病相关抗原图谱,而且能够通过整合实验验证信息与大规模蛋白质组学信息,支持疾病特异性标志物及潜在自身抗原的筛选。进一步在独立类风湿关节炎(RA)血清队列中的应用证明,该平台既能回溯已知临床标志物,也能提出新的候选免疫靶标,说明其具有明确的研究与转化价值。

研究人员采用的主要技术方法包括:基于 RNAcentral 和 IntroVerse 构建统一蛋白序列空间,并联合 UniProt 去冗余整合规范与非规范蛋白;从 IEDB 提取 T 细胞和 MHC 配体实验验证表位;自 PRIDE、MassIVE.quant、jPOST、PeptideAtlas、iProX 收集 14 种 ADs 的人类蛋白质组学数据;使用 DIA-NN 与 MaxQuant 进行质谱检索和蛋白定量;通过差异表达分析、稳健秩聚合(RRA)和免疫原性预测流程筛选候选自身抗原;独立 RA 血清队列来源于 5 例患者和 5 例健康对照。

3.1 SPAID 的总体概况与内容
研究人员首先构建了包含 576,516 条序列的非冗余统一蛋白空间,其中既包括 UniProt 规范蛋白,也包括来自 ncRNA 与内含子翻译预测的非规范蛋白。基于验证层的整合,平台汇集了大量来自 T 细胞实验和 MHC 配体实验的已验证表位,并将其映射到 21,349 个蛋白上,说明自身抗原来源并不局限于传统蛋白编码产物。与此同时,基于蛋白质组学的层级整合了 14 种 ADs、675 份人类样本、51 个队列中的 MS 证据,最终得到 26,085 个疾病相关蛋白。该结果表明,SPAID 在数据广度上实现了对自身免疫相关蛋白谱的系统覆盖,并为后续筛选候选自身抗原奠定了资源基础。

3.2 自身免疫性疾病中的蛋白表达模式
通过逐队列差异表达分析,研究人员将蛋白划分为“仅疾病中检测到”、显著上调、显著下调和其他四类。结果显示,在 14 种 ADs 中存在大量“仅疾病中检测到”的蛋白以及显著上调蛋白,且其中包含一定比例的非规范蛋白。进一步比较发现,多数“仅疾病中检测到”蛋白具有疾病特异性,但仍有一部分在多种 ADs 间共享,提示这些分子可能与广义免疫失衡相关。对于非规范蛋白,研究人员进一步评估了其跨独立队列的重复检出情况,发现银屑病、系统性红斑狼疮、克罗恩病和 RA 中相当比例的非规范蛋白具有较高重复性,且表达趋势一致。这说明数据库中的非规范蛋白信号并非随机噪声,而更可能代表稳定存在、与疾病相关的真实生物学实体。

3.3 候选自身抗原的鉴定
在全部 MS 鉴定肽段中,研究人员利用以 HLA-I(人类白细胞抗原 I 类)呈递、肽-MHC 稳定性及 T 细胞识别概率为核心的流程评估免疫原性,并进一步借助 PanPep 分析 T 细胞受体相互作用,最终将蛋白层面含有“免疫原性阳性”肽段的条目标记为候选自身抗原。结果显示,超过一半的疾病相关蛋白具有预测免疫原性,其中“仅疾病中检测到”蛋白中富集最为明显,上调蛋白中的免疫原性比例也高于下调蛋白。这说明炎症环境中升高或特异出现的蛋白更可能成为抗原加工与呈递底物。进一步整合疾病特异性蛋白质组学检出、预测免疫原性和实验表位支持三项特征后,研究人员得到 2,023 个高可信候选自身抗原,构成 SPAID 中最值得优先关注的核心集合。

3.4 Web 界面与使用方式
为增强可用性,研究人员开发了集搜索、浏览、比对、可视化和下载于一体的网络界面。用户可按疾病、组织或蛋白属性检索,也可在转录本、蛋白及肽段层面进行 BLAST 相似性搜索。数据库提供蛋白、肽段和基因三个层级的详细注释,包括表达热图、箱线图、火山图、三维结构、翻译后修饰位点以及质谱谱图可视化等内容。该部分结果说明,SPAID 不只是静态数据仓库,而是支持多层级证据联动分析的交互式研究平台。

3.5 SPAID 支持类风湿关节炎疾病特异性标志物发现
在独立 RA 血清蛋白质组学队列中,研究人员从 1,559 个鉴定蛋白中筛得 132 个 RA 相关蛋白。通过与 SPAID 中外部 RA 蛋白质组学数据重叠分析以及免疫原性筛选,研究人员识别出一批具有临床和免疫学意义的候选分子。IFI16 和 IgM 等已知相关分子被成功回溯,说明平台能够捕获既有生物标志物;同时,MYH9、GSTP1、HBG1/2、APOA4 等分子被提出为值得进一步验证的候选抗原或标志物。其中 APOA4 在既有文献中尚未与 RA 明确关联,但在该研究中表现出较强的疾病特异富集和预测免疫原性,体现了 SPAID 在发现新型候选靶标方面的潜力。

讨论部分指出,SPAID 的主要贡献在于以双层证据框架系统扩展了自身抗原图谱,并将三维结构、翻译后修饰位点等功能结构信息纳入统一平台,从而有助于理解抗原加工、表位暴露和致病性识别机制。与此同时,研究人员也明确说明了其局限性:当前免疫原性预测仅覆盖 HLA-III? no error must be HLA-I. Let's ensure. 修正 below. 当前版本仅覆盖 HLA-I,缺乏 HLA-II 数据,因而可能遗漏与 CD4+ T 细胞相关的重要自身抗原;整合数据主要来自血液和皮肤等易获取组织,对难获取器官来源的组织特异性抗原覆盖不足;MS 证据虽可支持蛋白存在,但不足以单独证明其细胞定位、定量丰度和生物学功能;非规范蛋白及其表位的生理呈递仍需谨慎解释。因此,SPAID 应被视为候选发现资源,而非绝对完备的已验证抗原目录。

研究结论可概括并翻译为:SPAID 建立了一个用于描绘多种 ADs 候选自身抗原全景的综合性资源。该平台通过结构化的双层证据框架,将已知自身抗原范围显著扩展至规范蛋白和非规范蛋白,并在独立 RA 队列中证明了其对已知标志物回溯和新候选分子发现的能力。尽管系统性限制仍然存在,研究人员计划在未来版本中进一步整合 HLA-II 数据和更广泛的组织蛋白质组学信息,并持续扩展基础设施与可视化能力,以确保 SPAID 持续作为全球研究社区可高效使用的重要资源。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号