
-
生物通官微
陪你抓住生命科技
跳动的脉搏
异构多元分类序列的建模与聚类分析:基于跨序列转移概率的混合模型创新
【字体: 大 中 小 】 时间:2025年08月01日 来源:Pattern Recognition 7.6
编辑推荐:
这篇综述聚焦多元分类序列(MCS)的建模与聚类难题,提出基于跨序列转移概率的混合模型,突破传统单变量序列(如马尔可夫模型)或同质状态假设的局限。作者通过仿真实验验证模型在聚类精度和计算效率的优势,并应用于英国家庭追踪调查(BHPS)和文本风格分析,为生命科学(如DNA序列)、临床医学(多器官病程监测)及社会科学提供通用分析框架。
亮点
方法论
表1列出了本节使用的符号体系。
实验
本节通过两项仿真研究评估模型性能。
数据描述
我们首先将模型应用于英国家庭追踪调查(BHPS)数据。BHPS覆盖英国250个地区,旨在研究社会经济变迁。这项家庭追踪调查基于政府邮编地址抽样,在1991-2008年间每年对成年家庭成员进行访谈。
讨论
本文提出的多元分类序列分析方法填补了该领域空白。传统方法将多元序列转化为单变量(导致状态数爆炸)或强加同质状态假设(如所有子序列共享相同状态),而新模型通过跨子序列转移概率混合框架,在保持计算可行性的同时提升解释力。
作者贡献声明
张莹莹:主笔初稿、可视化、验证、软件及方法论开发;沃洛迪米尔·梅尔尼科夫:审校、验证、项目监督及方法论指导。
利益冲突声明
作者声明不存在可能影响本研究的财务或个人关系。
致谢
本研究部分受西密歇根大学SFSA基金资助。
(注:翻译采用"病程监测"等医学场景化表述,保留k-modes等术语原格式,用"状态数爆炸"等生动比喻,省略文献标注符[1]等)
生物通微信公众号
知名企业招聘