
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于蛋白质组学数据的免疫细胞反卷积技术:方法学评估与软件工具开发
【字体: 大 中 小 】 时间:2025年08月10日 来源:Journal of Proteomics 2.8
编辑推荐:
本研究针对蛋白质组学数据在免疫细胞反卷积(Deconvolution)中的应用瓶颈,系统评估了预处理方法(如缺失值插补)和算法(CIBERSORTx/EPIC/BayesDeBulk)对细胞组成解析的影响。通过纯化免疫细胞群和模拟混合样本验证,证实最优参数下估计比例的Pearson相关系数>0.9,并开发R包proteoDeconv实现流程标准化。该研究为肿瘤微环境免疫浸润分析提供了新维度的技术支撑。
在肿瘤研究和临床诊疗中,免疫细胞浸润的组成分析具有重要价值。传统方法如流式细胞术和免疫组化虽直接但通量低,而基于转录组学的反卷积算法虽广泛应用,却面临转录本与蛋白质表达差异的瓶颈。随着质谱技术的发展,蛋白质组学数据能否用于精确解析细胞组成成为亟待探索的前沿问题。
瑞典隆德大学免疫技术系(Department of Immunotechnology, Lund University)的M?ns Zamore团队在《Journal of Proteomics》发表研究,通过系统评估蛋白质组学数据在免疫细胞反卷积中的适用性,开发了标准化分析工具。研究人员首先利用Ficoll密度梯度离心分离外周血单个核细胞(PBMC),通过荧光激活细胞分选(FACS)获得B细胞、T细胞等6种纯化免疫细胞群,并制备50:50的CD8+ T细胞与单核细胞混合样本。采用数据独立采集(DIA)质谱技术获取约2000种蛋白质表达谱,结合Rieckmann等发表的蛋白质组数据集,通过SimBu软件生成数百种计算机模拟混合物。使用limma差异分析构建特征矩阵,比较CIBERSORTx、EPIC等算法性能,最终开发出集成预处理和分析流程的R包proteoDeconv。
不同算法的性能比较
在纯化细胞测试中,CIBERSORT与CIBERSORTx表现最佳,BayesDeBulk次之,EPIC准确性最低。模拟混合样本分析显示,前两者Pearson相关系数达0.91,RMSE为0.04,显著优于其他方法。
数据预处理的关键影响
研究发现:1)蛋白分组处理方式(首选第一蛋白或最高强度蛋白)对结果影响较小;2)最小化缺失值插补法优于随机森林或kNN插补,使相关系数提升至0.91;3)标准化处理会破坏线性关系,未处理数据反卷积效果最优。
特征矩阵的优化策略
比较转录组与蛋白质组来源的特征矩阵发现,基于Rieckmann蛋白质组数据的矩阵使相关系数达0.96,显著优于scRNA-seq矩阵(0.85)。参数测试表明,每个细胞类型包含200-400个蛋白质的特征矩阵性能最佳,过多标记蛋白反而降低准确性。
实验验证与局限性
实际50:50混合样本与计算机模拟结果高度一致,证实模拟方法的可靠性。但研究发现CD8+与CD4+ T细胞仍存在交叉干扰,且单核细胞因蛋白质含量更高而被高估,提示未来算法需引入蛋白质含量校正因子。
该研究首次系统论证了蛋白质组学数据用于免疫细胞反卷积的可行性,确立"保守插补+非标准化处理+蛋白质特征矩阵"的最佳实践方案。所开发的proteoDeconv工具填补了蛋白质组学反卷积流程标准化的空白,为肿瘤免疫微环境研究提供了超越转录组维度的新视角。未来随着单细胞蛋白质组学技术的发展,特征矩阵的精度有望进一步提升,推动该方法在精准医疗中的应用。
生物通微信公众号
知名企业招聘