基于数据的免疫肽组学方法发现低丰度细菌表位
《Journal of Proteome Research》:Data-Independent Immunopeptidomics Discovery of Low-Abundant Bacterial Epitopes
【字体:
大
中
小
】
时间:2025年10月31日
来源:Journal of Proteome Research 3.6
编辑推荐:
免疫肽组学中,数据独立获取(DIA)方法通过 diaPASEF 联合谱系中心(FragPipe diaTracer 和 Spectronaut directDIA)和肽中心(DIA-NN)策略,显著提升低丰度肽检测能力,发现37个高置信度李斯特菌抗原肽,优于传统数据依赖获取(DDA)。
近年来,随着质谱技术的不断进步,基于质谱的免疫肽组学(immunopeptidomics)在揭示人类白细胞抗原(HLA)分子呈递的短肽片段(即免疫肽)方面发挥了重要作用。这些免疫肽不仅可以指导疫苗设计,还能为免疫治疗提供关键信息。尽管数据依赖性采集(DDA)一直是处理复杂免疫肽数据库搜索的常用方法,但数据独立性采集(DIA)正逐渐成为免疫肽组学研究中的重要工具。本研究通过比较diaPASEF与常规的ddaPASEF在整体免疫肽组分析和细菌表位发现中的表现,展示了DIA在提高低丰度免疫肽检测能力方面的潜力。
HLA分子在细胞表面呈递来自病原体的肽片段,这一过程对于T细胞识别并清除感染细胞至关重要。因此,识别这些呈递的细菌表位对于疫苗研发具有重要意义。借助高灵敏度的质谱方法,研究人员能够检测和量化从纯化样本中获得的HLA结合肽。本研究中,我们采用了一种基于数据独立采集的diaPASEF方法,通过预先设定的离子迁移率和质荷比(m/z)窗口,实现了对整个前体离子空间的全面和重复采样,这可能带来更高的灵敏度、数据完整性以及更准确的相对定量能力。
然而,与常规的DDA分析相比,DIA数据的处理更加复杂,因为肽前体在混合状态下被共碎片化,导致MS/MS谱图的复杂性。此外,免疫肽的搜索空间通常比常规的胰蛋白酶消化分析更大,这使得直接搜索DIA数据变得具有挑战性。为了克服这一难题,免疫肽组学研究常常限制搜索范围,仅针对预测的HLA结合肽进行分析。尽管如此,直接搜索DIA数据与完整的序列数据库相结合,可能有助于发现和量化更多的HLA肽。
在本研究中,我们采用了两种主要的DIA分析策略:谱图中心(spectrum-centric)和肽中心(peptide-centric)。谱图中心方法通过从DIA数据中解卷积伪MS/MS谱图,然后使用传统的DDA搜索算法进行分析。这种方法在DIA-Umpire中首次提出,并在diaPASEF数据处理中被Spectronaut的directDIA算法和FragPipe的diaTracer流程所采用。另一方面,肽中心方法则依赖于使用深度学习模型生成的蛋白质组范围的预测谱图库,并通过DIA-NN软件进行搜索,以实现更全面的肽识别。
我们假设,通过diaPASEF的全面记录和谱图中心分析,可以提高低丰度细菌免疫肽的检测能力。为此,我们评估了diaPASEF在分析被李斯特菌(Listeria monocytogenes)感染的细胞培养物时,对细菌抗原的发现能力。此外,我们还展示了如何利用DIA-NN软件生成并搜索覆盖整个蛋白质组的预测谱图库,以发现其他方法未能识别的低丰度免疫肽。通过这种方法,我们不仅提高了免疫肽的识别数量,还提升了检测的准确性和全面性。
在实验过程中,我们对四种未感染和四种感染李斯特菌的HeLa细胞培养物进行了分析。这些样本此前已通过ddaPASEF采集和分析。为了进一步提高DIA数据的分析效果,我们优化了diaPASEF的采集方案,并通过py_diAID工具生成了覆盖大部分离子云的采集方案。随后,我们使用了Spectronaut的directDIA和FragPipe的diaTracer算法对diaPASEF数据进行了谱图中心分析。这些分析方法能够从DIA数据中解卷积伪MS/MS谱图,并通过传统的DDA搜索算法进行识别。
为了提高分析的准确性,我们还采用了一个多引擎重新评分(rescoring)流程,该流程结合了MSFragger、Comet、Sage和PEAKS Studio等搜索引擎的结果,并通过TIMS2Rescore工具进行整合。最终,我们利用DIA-NN软件对这些重新评分后的结果进行搜索,并生成了一个包含6860个肽前体的实验性谱图库。这些结果表明,通过谱图中心分析,可以识别出更多的免疫肽,尤其是那些低丰度的肽。
为了进一步验证这些方法的有效性,我们还利用DIA-NN生成了覆盖所有可能的MHC I结合肽(长度为8-12个氨基酸)的预测谱图库,并通过DIA-NN软件对这些数据进行了搜索。我们发现,通过这种肽中心分析方法,能够识别出比谱图中心方法更多的免疫肽。这表明,使用预测谱图库进行DIA分析能够显著提高低丰度免疫肽的检测能力。
此外,我们还对一些已知的李斯特菌肽进行了合成,并通过DIA-NN软件生成了相应的谱图库。通过将这些合成肽的片段强度与实验数据进行比较,我们验证了DIA-NN在识别低丰度免疫肽方面的可靠性。我们发现,这些低丰度肽在实验数据中表现出较高的结合能力,从而进一步支持了DIA-NN在免疫肽组学分析中的优势。
总的来说,本研究展示了如何通过DIA谱图中心和肽中心分析方法,发现更多低丰度的免疫肽。这两种方法在检测和量化细菌表位方面都显示出巨大的潜力,尤其是在提高低丰度肽识别能力方面。尽管DIA分析在某些方面存在挑战,例如难以确定有效的假发现率(FDR),但通过实验优化深度学习模型和不断提升计算能力,这些方法的性能和可行性将进一步提高。结合DDA和DIA的采集方式,可以最大化对细菌免疫肽的检测,从而为细菌疫苗的抗原发现提供新的思路。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号