《Frontiers in Immunology》:ULMnet: inferring physical cell-cell communication networks from scRNAseq data using univariate linear models
编辑推荐:
本文推荐一种创新计算方法ULMnet,该技术利用单变量线性模型(ulm)从单细胞RNA测序(scRNAseq)数据中识别多重捕获细胞(multiplets),解析其细胞组成,并推断组织中的物理性细胞互作网络。研究通过FACS分选双细胞对验证显示高精确度(~99%),在部分解离组织数据中成功还原微解剖结构,并在癌症scRNAseq数据中通过空间转录组学验证互作真实性。该方法为利用常规scRNAseq数据挖掘细胞空间互作提供了新范式。
引言:组织中的细胞通过直接物理接触或分泌介质进行短程和长程相互作用。单细胞RNA测序(scRNAseq)已成为解析细胞异质性的重要工具,但组织解离过程会破坏细胞空间背景,限制传统通讯推断方法对物理互作的捕获。scRNAseq中的多重捕获细胞(多为双细胞捕获)可能代表未完全解离的物理连接细胞,为推断物理性细胞互作提供了突破口。
方法:本研究开发了ULMnet计算方法,其核心流程包括:首先从注释的scRNAseq数据中生成细胞类型特异性基因标志(默认选取top100差异基因);接着通过单变量线性模型(ulm)计算每个细胞条形码的标志活性得分(t值>1且p<0.05视为阳性);根据得分模式将细胞分类为单细胞(仅一种标志阳性)或多重细胞(多种标志阳性);最后通过频率过滤(>5-10次)构建细胞互作网络。研究应用了多种数据集验证方法,包括FACS分选的树突细胞-T细胞(DC-T)对、肝细胞-内皮细胞对、部分解离的肠道/肺组织数据,以及卵巢癌、乳腺癌的常规scRNAseq数据,并利用空间转录组数据(Visium平台)通过RCTD方法进行空间共定位验证。
结果与讨论:在FACS分选双细胞对的基准测试中,ULMnet对体外培养DC-T双细胞对的检测灵敏度达56%,精确度达99.7%,显著优于Neighborseq(52.1%/98.9%)和CIcADA(21.7%/88.1%)。对肝细胞-内皮细胞对的检测灵敏度为56.6%,远超对比方法的18.3%以下。在部分解离组织数据中,ULMnet成功还原了肠道隐窝-绒毛单元的微解剖结构(如祖细胞-肠上皮细胞、杯状细胞-潘氏细胞互作)和肺泡单元的结构特征(内皮细胞-肺泡巨噬细胞互作)。对常规scRNAseq数据的分析显示,在乳腺癌数据中发现的T细胞-B细胞/浆母细胞互作网络,与空间转录组中免疫细胞空间共定位(Spearman相关系数r=0.5)高度一致;卵巢癌数据中成纤维细胞-内皮细胞(r=0.15)等基质互作也得到空间验证。进一步配体-受体对(LRP)分析发现,T-B双细胞中富集HLA-TCR相互作用(如HLA-C_CD3G、B2M_CD3D),且在空间共定位区域同样高表达,提示抗原呈递过程的生物学真实性。
结论:ULMnet首次将线性模型应用于scRNAseq多重细胞解析,为从常规单细胞数据中挖掘物理性细胞互作提供了高效工具。其局限性在于无法区分随机双细胞与生物性双细胞,需结合生物学合理性和空间验证进行结果解读。该方法为研究组织微环境、癌症免疫互作等提供了新的计算生物学视角。