
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于ThresholdR的CITE-seq数据自动去噪方法:提升细胞类型注释与下游分析性能
【字体: 大 中 小 】 时间:2025年07月10日 来源:Cell Reports Methods 4.3
编辑推荐:
本文推荐一种新型CITE-seq数据去噪工具ThresholdR,该工具通过高斯混合模型(GMM)自动识别抗体衍生标签(ADT)信号与噪声的阈值,显著优于现有方法DSB和CellBender。研究证实其可降低假阴性率,提升细胞类型注释准确性,并拓展应用于CyTOF数据与样本解复用,为单细胞多组学分析提供可靠解决方案。
CITE-seq技术通过寡核苷酸标记的单克隆抗体(mAbs)在单细胞RNA测序(scRNA-seq)基础上整合细胞表面表型信息,但其抗体衍生标签(ADT)数据存在环境抗体、非特异性结合和滴定误差等技术噪声。传统流式细胞术(FACS)通过设门(gating)和荧光减一对照(FMO)消除噪声,但CITE-seq缺乏类似控制手段。ThresholdR应运而生,通过自动化建模解决这一瓶颈问题。
ThresholdR基于高斯混合模型(GMM)拟合ADT数据的多模态分布,利用期望最大化(EM)算法计算噪声组分参数(均值μ1和标准差SD),默认以μ1 + 3SD作为信号/噪声分割阈值。通过贝叶斯信息准则(BIC)选择最优组分数量(K=1-3),避免过拟合。在包含48种抗体的CAVA队列数据中,33种呈双峰分布,15种需三峰拟合(如CD4在单核细胞、CD4+T细胞和CD8+T细胞中的三峰特征)。
在16万例人PBMC数据集(Hao et al.)中,ThresholdR成功去除CD3、CD19等关键标记的非特异性信号。与流式细胞术结果对比显示,其阈值设定与FACS设门高度一致。UMAP可视化显示,去噪后细胞亚群边界更清晰,热图显示噪声信号显著降低。
基于流式分选的CD4+T细胞、CD8+T细胞和单核细胞数据集上,ThresholdR的受试者工作曲线(AUC=0.95)远超DSB(AUC=0.73)和CellBender(AUC=0.66)。DSB因强制双峰分布导致单核细胞中CD3假阳性,而CellBender未能消除Fc受体介导的非特异性结合。有趣的是,ThresholdR与CellBender联用可将后者的AUC提升至0.96,形成互补优势。
ThresholdR在质谱流式(CyTOF)数据中成功鉴定B细胞、T细胞亚群和单核细胞亚型(经典、中间、非经典)。在样本解复用(hashtag demultiplexing)中,其性能与CellRanger和Seurat MULTIseqDemux相当。差异表达分析显示,去噪后CD4+T细胞的差异基因数量从65增至207,显著提升下游分析灵敏度。
ThresholdR的创新性在于模拟流式设门逻辑,同时解决环境抗体和Fc结合两类噪声源。其局限性在于可能遗漏罕见细胞群,建议结合转录组再聚类优化。未来可整合加权最近邻(WNN)分析,进一步提升多组学数据整合效果。该工具已开源(GitHub),为单细胞免疫学研究提供标准化解决方案。
生物通微信公众号
知名企业招聘