基于互信息最大化的变分自编码器scInfoMaxVAE:提升单细胞RNA测序数据降维与聚类分析的新方法

【字体: 时间:2025年09月04日 来源:Computational Biology and Chemistry 3.1

编辑推荐:

  这篇研究提出scInfoMaxVAE模型,通过结合互信息(MI)最大化与零膨胀计数似然的变分自编码器(VAE),显著提升单细胞RNA测序(scRNA-seq)数据的降维效果。在12个数据集上的测试表明,其聚类指标(NMI 0.94)优于t-SNE(0.66)和scVI(0.38),尤其擅长处理技术噪声和保留邻域结构,为单细胞分析提供了可重复的解决方案。

  

亮点

工作流程

图1展示了scInfoMaxVAE分析scRNA-seq数据的流程。该模型专注于降维,作为scRNA-seq预处理的最终步骤,为下游分析提供输入。

  • 数据收集:从不同组织收集scRNA-seq数据以研究细胞多样性,结合公共和私有数据提升稀有细胞类型的检测能力。本研究的数据集包括Baron(Human-1–3, Mouse-1–2)、Klein等。

互信息对变分自编码器的影响分析

本节分析了模型对超参数α和β的敏感性(Camp数据集)。目标是理解这些参数如何影响聚类质量(通过ARI、NMI、同质性和完整性评分衡量)。

首先调整α参数(控制损失函数权重),评估其对聚类性能的影响(图3A)。当α从1增至100时,所有指标(尤其是ARI)呈现明显变化趋势。

讨论

scInfoMaxVAE通过互信息最大化显著提升了scRNA-seq数据的降维效果。模型在多样数据集上表现稳健,关键优势包括:

  1. 1.

    跨生物场景的一致性高表现(12个数据集中NMI持续领先);

  2. 2.

    对零膨胀和技术噪声的显式建模;

  3. 3.

    邻域结构保留能力突出。

结论

scInfoMaxVAE通过优化互信息,显著提升了scRNA-seq数据的表征质量,在聚类和拟时序推断中展现出优越性能。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号