
-
生物通官微
陪你抓住生命科技
跳动的脉搏
DeepIMB:微生物组数据中非生物性零计数的插补方法
《Genes & Genomics》:DeepIMB: Imputation of non-biological zero counts in microbiome data
【字体: 大 中 小 】 时间:2025年11月10日 来源:Genes & Genomics 1.7
编辑推荐:
微生物组数据分析中非生物零计数严重影响数据质量,DeepIMB方法通过伽马正态混合模型识别零值并利用深度神经网络整合多源信息进行填补,在MSE、Pearson相关系数和Wasserstein距离指标上优于传统方法,显著提升数据完整性和下游分析可靠性。
由于测序深度低和采样变异,非生物性零计数的高发生率在微生物组数据分析中构成了重大挑战。这些零值可能会扭曲分类群的丰度分布,阻碍真实生物信号的识别,从而复杂化后续分析。
为了解决微生物组数据集中非生物性零计数的问题,我们提出了DeepIMB,这是一种基于深度学习的插补方法,专门用于准确识别和插补非生物性零计数,同时保持生物数据的完整性。
DeepIMB主要分为两个阶段。首先,它使用伽马-正态混合模型对标准化并对数转换后的分类群计数矩阵进行处理,以识别非生物性零值。其次,它利用深度神经网络模型对这些零值进行插补,该模型整合了多种信息来源,包括分类群丰度、样本协变量和系统发育距离,从而学习微生物组数据中的复杂非线性关系。
通过利用多种数据类型的综合信息,DeepIMB能够准确插补非生物性零值,同时保留真实的生物信号。在我们的两项模拟研究中,DeepIMB在均方误差、皮尔逊相关系数和Wasserstein距离方面均优于现有的插补方法。
DeepIMB有效解决了微生物组数据中非生物性零计数带来的挑战。通过提高数据质量和后续分析的可靠性,DeepIMB代表了微生物组研究方法论的重大进步。
由于测序深度低和采样变异,非生物性零计数的高发生率在微生物组数据分析中构成了重大挑战。这些零值可能会扭曲分类群的丰度分布,阻碍真实生物信号的识别,从而复杂化后续分析。
为了解决微生物组数据集中非生物性零计数的问题,我们提出了DeepIMB,这是一种基于深度学习的插补方法,专门用于准确识别和插补非生物性零计数,同时保持生物数据的完整性。
DeepIMB主要分为两个阶段。首先,它使用伽马-正态混合模型对标准化并对数转换后的分类群计数矩阵进行处理,以识别非生物性零值。其次,它利用深度神经网络模型对这些零值进行插补,该模型整合了多种信息来源,包括分类群丰度、样本协变量和系统发育距离,从而学习微生物组数据中的复杂非线性关系。
通过利用多种数据类型的综合信息,DeepIMB能够准确插补非生物性零值,同时保留真实的生物信号。在我们的两项模拟研究中,DeepIMB在均方误差、皮尔逊相关系数和Wasserstein距离方面均优于现有的插补方法。
DeepIMB有效解决了微生物组数据中非生物性零计数带来的挑战。通过提高数据质量和后续分析的可靠性,DeepIMB代表了微生物组研究方法论的重大进步。