突破局限:隐半马尔可夫模型(HSMMs)非齐次状态驻留时间分布的深度探究及其应用

【字体: 时间:2025年05月07日 来源:Computational Statistics & Data Analysis 1.5

编辑推荐:

  在时间序列分析中,隐马尔可夫模型(HMMs)存在局限,隐半马尔可夫模型(HSMMs)虽有所改进但仍有不足。研究人员开展 HSMMs 非齐次状态驻留时间分布研究,得出模型重要性质及应用优势,为相关领域分析提供更有效工具。

  在时间序列数据的分析领域,隐马尔可夫模型(Hidden Markov Models,HMMs)曾经是备受瞩目的 “明星” 工具。它就像一个神秘的解码器,能够从复杂的数据中挖掘出隐藏的信息,在生态学、经济学、医学等多个领域都大显身手。比如在生态学中,它能帮助科学家解读动物的行为模式;在经济学里,可用于分析市场的变化规律。然而,HMMs 并非完美无缺。它假定隐藏状态的停留时间,也就是状态驻留时间(state dwell time)遵循几何分布,这一特性在实际应用中遭遇了诸多挑战。因为现实世界里,很多过程的驻留时间并非如此简单,像人类或动物的休息状态,其持续时间往往不符合这种简单的分布规律,使得 HMMs 在面对这些复杂情况时显得力不从心 。
为了弥补 HMMs 的不足,隐半马尔可夫模型(Hidden semi - Markov models,HSMMs)应运而生。HSMMs 允许对状态驻留时间分布进行明确的设定和估计,这让它在处理复杂的时间序列数据时更具优势,吸引了众多研究者的目光。但传统的 HSMMs 也存在局限性,其通常应用的模型局限于时间齐次的驻留时间分布,这在很多实际场景中并不符合现实情况。为了让 HSMMs 能更好地应对复杂多变的现实世界,研究人员踏上了探索的征程。

此次开展相关研究的研究机构信息未明确给出。研究人员聚焦于 HSMMs 的非齐次状态驻留时间分布展开深入研究。他们提出了一种全新的框架,旨在让 HSMMs 能够适应受外部协变量影响而变化的非齐次驻留时间分布。通过不懈努力,研究人员取得了一系列重要成果。他们不仅推导出了模型在周期性变化协变量这种特殊情况下的重要性质,还进行了模拟研究,为模型的应用提供了实用的建议。在实际应用方面,他们将新模型应用于北极麝牛的运动轨迹分析,展现出该模型在实际问题中的强大能力 。

这项研究意义重大。它突破了传统 HSMMs 的局限,为时间序列分析提供了更强大、更灵活的工具。在实际应用中,无论是对生物行为的研究,还是对经济趋势的预测,新模型都能提供更准确、更符合实际情况的分析结果,帮助人们更好地理解和应对复杂的现实问题。该研究成果发表在《Computational Statistics 》上。

研究人员在此次研究中用到的主要关键技术方法包括:首先,通过将 HSMMs 的半马尔可夫过程近似为马尔可夫链(Markov chain),在扩展状态空间上进行操作,实现对模型的参数估计;其次,利用 R 语言中的相关工具,如 LaMa 和 RTMB 包,进行模型的拟合和计算,这些工具能够高效地处理复杂的模型运算。

下面来看具体的研究结果:

  • 模型构建与理论推导:研究人员构建了非齐次 HSMMs 模型,详细阐述了其基本结构和推理过程。在模型中,定义了潜在过程和观测过程,潜在过程是一个 N 状态的半马尔可夫链,其状态驻留时间分布由一组概率分布确定,转移动态由嵌入马尔可夫链控制。对于非齐次情况,研究人员通过调整转移概率矩阵(t.p.m.)的定义,使其能够适应时间变化的驻留时间分布。同时,推导出了在周期性变化协变量情况下,模型的一些重要性质,如周期性变化的无条件状态分布以及整体状态驻留时间分布等。
  • 模拟研究:为了深入了解模型的性能,研究人员进行了一系列模拟实验。在近似质量研究中,通过模拟数据和拟合不同聚合大小的非齐次 HSMMs 模型,发现合理选择聚合大小可确保近似似然与精确似然几乎相等,保证模型的准确性;在估计器一致性研究方面,模拟不同长度的时间序列并拟合模型,结果表明最大似然估计(MLE)具有一致性,但可靠估计需要较大的数据集;在模型误设评估中,对比了正确模型、非齐次 HMM 和齐次 HSMM,发现误设模型会导致模型隐含分布与真实经验分布的明显不匹配,不过解码状态序列可用于揭示模型误设;在选择聚合大小的研究中,通过新的模拟设置,展示了根据解码状态和经验驻留时间分布选择聚合大小的策略,并发现计算时间与聚合大小大致呈二次关系。
  • 应用案例 —— 麝牛运动分析:研究人员将非齐次 HSMMs 应用于北极麝牛的运动轨迹分析。他们使用了包含 6825 个观测值的 GPS 数据集,将其转换为步长和转向角进行分析。研究人员考虑了不同类型的模型,包括非齐次 HMM 和具有不同参数设置的 HSMM。结果发现,HSMMs 相较于 HMMs 能显著改善模型拟合效果,且考虑周期性变化的 HSMMs 表现更优。通过分析模型的结果,研究人员能够解释麝牛的不同行为状态,如休息、觅食和旅行,并发现其行为在一天中的不同时间具有明显的变化规律。

研究结论和讨论部分指出,此次研究成功扩展了 HSMMs 的框架,使其能够处理非齐次状态驻留时间分布,通过直接数值近似最大似然估计实现了完全非齐次 HSMMs 的估计。这一成果克服了以往的障碍,拓宽了模型的实际应用范围。模拟研究为模型应用提供了重要的实践指导,而麝牛运动分析案例则充分展示了新模型在处理实际数据时的优势。在数据具有非单调状态驻留时间和显著周期性变化的场景中,非齐次 HSMMs 是更好的选择,尽管它可能会带来额外的计算负担,但避免了不切实际的假设,显著提升了模型的拟合效果,为相关领域的研究提供了更强大的分析工具,推动了时间序列分析在各个领域的进一步发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号