
-
生物通官微
陪你抓住生命科技
跳动的脉搏
使用主成分树集成方法对纵向多变量轨迹进行聚类
《BMC Medical Research Methodology》:Clustering longitudinal multivariate trajectories using an ensemble of principal component trees
【字体: 大 中 小 】 时间:2026年06月11日 来源:BMC Medical Research Methodology 3.4
编辑推荐:
摘要目的对纵向数据进行聚类是一项具有挑战性的任务,尤其是当测量数据维度较高、采样不规则或存在噪声时。我们旨在提供一个灵活且易于解释的框架,用于识别有意义的时间子群体及其关键特征。方法我们提出了TAPIO,这是一种基于集成方法的聚类技术,并对其进行了纵向扩展,包括longTAPIO
对纵向数据进行聚类是一项具有挑战性的任务,尤其是当测量数据维度较高、采样不规则或存在噪声时。我们旨在提供一个灵活且易于解释的框架,用于识别有意义的时间子群体及其关键特征。
我们提出了TAPIO,这是一种基于集成方法的聚类技术,并对其进行了纵向扩展,包括longTAPIOtrajectories、longTAPIOsample和longTAPIOMLD等变体。这些变体结合了降维技术和聚类特定的特征重要性,能够对单变量和多变量轨迹以及规则或不规则采样的纵向数据进行稳健的聚类。
仿真研究表明,TAPIO能够准确恢复聚类结构,识别相关特征,并且其性能可与现有方法相媲美。longTAPIOtrajectories在规则采样数据上表现优异,而longTAPIOMLD在处理不规则测量数据时优于其他方法。在临床队列中的应用揭示了由关键心脏指标驱动的具有不同生存模式的患者亚群;对高维纵向蛋白质组学数据的分析则发现了在分子层面上具有明显差异的聚类,并且这些聚类的蛋白质重要性特征易于解释。
对纵向数据进行聚类是一项具有挑战性的任务,尤其是当测量数据维度较高、采样不规则或存在噪声时。我们旨在提供一个灵活且易于解释的框架,用于识别有意义的时间子群体及其关键特征。 我们提出了TAPIO,这是一种基于集成方法的聚类技术,并对其进行了纵向扩展,包括longTAPIOtrajectories、longTAPIOsample和longTAPIOMLD等变体。这些变体结合了降维技术和聚类特定的特征重要性,能够对单变量和多变量轨迹以及规则或不规则采样的纵向数据进行稳健的聚类。 仿真研究表明,longTAPIOtrajectories在规则采样数据上表现优异,而longTAPIOMLD在处理不规则测量数据时优于其他方法。在临床队列中的应用揭示了由关键心脏指标驱动的具有不同生存模式的患者亚群;对高维纵向蛋白质组学数据的分析则发现了在分子层面上具有明显差异的聚类,并且这些聚类的蛋白质重要性特征易于解释。 目的
方法
结果
结论