编辑推荐:
本研究为解决传统单细胞RNA测序分析中忽视基因表达变异性的局限,开发了spline-DV方法,用于分析单细胞基因表达数据中的差异变异性(DV),揭示了肥胖、纤维化和癌症等疾病相关基因表达变异性的新见解,为细胞功能研究提供了新维度。
单细胞RNA测序(scRNA-seq)技术的出现极大地推动了我们对细胞异质性的理解。然而,传统的分析方法大多集中在基因表达的均值差异上,忽略了细胞间基因表达变异性所蕴含的丰富信息。为了填补这一空白,美国德克萨斯A&M大学的研究人员开发了一种名为spline-DV的统计框架,专门用于分析单细胞基因表达数据中的差异变异性(DV)。该方法通过比较两种实验条件下细胞的基因表达变异性,识别出在一种条件下比另一种条件更具功能活性或转录参与度更高的基因。研究人员通过对肥胖、纤维化和癌症等疾病相关单细胞数据的分析,验证了spline-DV方法的有效性,并揭示了大量与疾病相关的差异变异性基因,这些基因在传统差异表达(DE)分析中往往被忽视。该研究不仅为理解细胞功能提供了新的视角,还为相关疾病的机制研究和治疗靶点发现提供了新的思路。论文发表在《npj Systems Biology and Applications》上。
在研究中,研究人员首先基于基因表达的均值、变异系数(CV)和dropout率三个维度构建了一个三维模型,通过独立拟合两条样条曲线来分别代表两种条件下的基因表达“期望”模式,并计算每个基因在各自条件下的偏差向量,进而得到差异变异性(DV)分数。通过这种方法,研究人员能够在不依赖于基因表达均值差异的情况下,独立评估基因表达变异性在不同条件下的变化。
在实验验证方面,研究人员通过模拟数据和实际的单细胞RNA测序数据集(包括饮食诱导的肥胖小鼠脂肪细胞、慢性肝纤维化小鼠肝星状细胞和结直肠癌患者上皮细胞的数据)来评估spline-DV方法的性能。结果表明,spline-DV能够成功识别出具有显著差异变异性的基因,并且这些基因在功能上与相应的细胞状态和疾病条件密切相关。例如,在肥胖小鼠脂肪细胞的研究中,spline-DV识别出的差异变异性基因富集在脂肪细胞核心通路中,涉及脂质代谢、胰岛素响应和脂肪酸生物合成等过程;在肝纤维化研究中,识别出的基因与纤维化进展直接相关,包括胶原蛋白基因和参与细胞外基质重塑的酶基因;在结直肠癌研究中,识别出的基因涉及细胞黏附、细胞外基质重塑和成纤维细胞生长因子信号传导等过程,这些过程支持癌细胞增殖和转移潜力。
此外,研究人员还比较了spline-DV方法与其他传统差异表达分析方法(如Wilcoxon秩和检验、DESeq2和MAST)以及另一种差异变异性分析方法BASiCS的结果。结果显示,spline-DV方法识别出的差异变异性基因与传统差异表达基因之间存在有限的重叠,这表明spline-DV能够揭示传统方法所遗漏的基因表达变异性相关的生物学信息。同时,spline-DV在计算效率上也表现出显著优势,能够在短时间内处理大规模数据集。
综上所述,spline-DV方法为单细胞基因表达数据分析提供了一种新的工具,能够更全面地揭示基因表达变异性在细胞功能和疾病发生发展中的作用。通过优先考虑基因表达变异性,该方法为理解细胞功能的复杂性和动态性提供了新的视角,并为未来的疾病建模、药物反应研究和复杂组织异质性理解等提供了有力支持。