编辑推荐:
该综述聚焦单细胞转录组分析新方法 RISE(基于张量分解技术 PARAFAC2),其可将变异分解为条件、细胞和基因特异性模式,无需预先细胞注释即可揭示药物响应及狼疮相关基因模块。研究通过药物扰动和系统性红斑狼疮(SLE)样本验证其效能,为多条件单细胞数据建模提供统一框架。
研究背景与方法
单细胞测序技术的发展使多条件单细胞数据分析成为挑战,传统方法如矩阵分解难以分离细胞间变异与条件特异性变异。本文提出 RISE(Reduction and Insight in Single-Cell Exploration)方法,基于 PARAFAC2 张量分解,将数据组织为条件 - 细胞 - 基因三维张量,通过正交普罗克拉斯提斯(Orthogonal Procrustes)算法对齐细胞状态,结合典型多线性分解(CPD)分离不同维度变异,无需预先细胞注释或假设数据分布,适用于分析药物扰动、疾病样本等多条件单细胞数据。
RISE 的核心优势与验证
在药物扰动实验中,RISE 分析人外周血单个核细胞(hPBMCs)经 40 种 FDA 批准药物处理的数据,分离出细胞间变异(如浆细胞样树突状细胞(pDCs)特异性基因模块)和条件特异性变异(如前列腺素类似物前列地尔诱导的血管生成相关基因模块)。与主成分分析(PCA)相比,RISE 在保留条件特异性差异的同时,更有效揭示稀有细胞亚群(如仅占 5% 的 pDCs)及其基因特征(如 FXYD2、SERPINF1),并量化药物对单核细胞亚群的差异化影响(如糖皮质激素诱导髓系抑制细胞扩增)。
在系统性红斑狼疮中的应用
针对 162 例 SLE 患者和 99 例健康对照的 hPBMC 单细胞数据,RISE 通过 30 维分解实现 0.94 的 ROC 曲线下面积(AUC),优于传统伪批量分析。其识别出 naive CD4?/CD8? T 细胞减少相关模块(负相关基因如 CCR7、LEF1)和干扰素(IFN)诱导基因模块(如 IFI44、MX1、IFITM3),后者在经典单核细胞(CMs)和 CD4?效应记忆 T 细胞(TEM)亚群中特异性表达。此外,发现 SLE 患者中 RETN?/S100A?单核细胞亚群与炎症通路激活相关,揭示疾病新机制。
讨论与展望
RISE 作为无监督线性降维方法,避免批次效应校正的主观偏差,直接通过数据驱动解析变异来源。其可扩展至多组学数据耦合分析、空间转录组等领域,但需注意组件数量选择及技术变异与生物信号的区分。研究表明,RISE 为解析单细胞异质性、识别疾病相关细胞亚群及基因模块提供了高效工具,尤其在复杂疾病如 SLE 的发病机制研究中具有重要应用潜力。