基于自相似性引导回归与对比增强的脊柱分割方法研究

【字体: 时间:2025年08月25日 来源:Visual Informatics 3.9

编辑推荐:

  为解决高维数据聚类中难以同时可视化聚类结果、离群值和相关性等问题,研究人员提出Hamiltonian Cycle Clustering with Asymmetric Correlation (HCC-AC)框架,通过结合全局与局部结构的深度聚类(GLDC)提取样本概率分布,利用广义相关性度量(GMC)学习簇间非对称相关性,并基于最优哈密顿循环实现可视化。实验表明,HCC-AC能有效呈现聚类、离群值及非对称相关性,为高维数据分析提供新视角。

  

在当今大数据时代,高维数据如医学图像、基因表达矩阵和市场信号等已成为科学发现和工业决策的重要基础。然而,面对这些复杂数据,分析人员通常希望同时获得三个关键问题的答案:哪些样本属于同一类别、不同类别之间的相似度如何、以及它们之间存在怎样的相关性。传统的聚类方法仅能提供硬标签(hard labels),既无法展现类别间的亲和力(inter-cluster affinities),也无法揭示相关性流动(correlation flow)。现有的可视化方法如多维尺度分析(MDS)和t分布随机邻域嵌入(t-SNE)虽然能部分呈现数据结构,但难以同时满足全局与局部结构的保留需求,更无法展示非对称相关性。这些局限性严重制约了高维数据的深度挖掘与解读。

针对这一挑战,Tianyi Huang、Zhengjun Zhang和Shenghui Cheng在《Visual Informatics》发表了创新性研究。团队提出哈密顿循环聚类与非对称相关性(HCC-AC)框架,通过三步实现高维数据的可视化解析:首先设计全局-局部深度聚类(GLDC)方法,通过联合优化全局与局部损失函数提取样本概率分布;其次利用广义相关性度量(GMC)量化簇间非对称相关性;最后将概率分布与相关性映射至最优哈密顿循环上,形成可解释的环形可视化图谱。该研究在MNIST、Fashion等五个基准数据集上验证了方法的有效性。

关键技术方法包括:1)GLDC模型通过重构损失、图学习损失和增强学习损失联合优化,提取兼具局部结构与全局相似性的概率分布;2)基于动态规划生成最优哈密顿循环,将聚类锚点(anchors)按相似度排序并均匀映射至圆周;3)利用GMC计算非对称相关性,通过热核函数调整可视化间距。实验使用MNIST-test等公开数据集,通过聚类准确率和可视化对比评估性能。

研究结果部分,哈密顿聚类在高维数据中的实现显示,GLDC能有效分离MNIST手写数字的不同类别,同时将形状相似的数字(如"9"和"4")映射至相邻位置(图5)。基于SGMC的非对称相关性映射通过符号化GMC(Signed GMC),成功识别出Fashion数据集中运动鞋与凉鞋、踝靴之间的设计关联(图10)。交互系统中的任务实现证明,通过调节超参数ψ可动态调整簇间距离,系统还能实时显示样本归属概率与非对称相关系数(图12)。

结论指出,HCC-AC首次实现了聚类结果、离群值和非对称相关性的同步可视化。其创新性体现在:1)GLDC模型统一全局与局部结构学习;2)哈密顿循环映射保留拓扑关系;3)GMC量化非对称影响。该框架为医学图像分析、基因表达解读等领域提供了新工具,未来可拓展至多视角数据融合分析。研究局限性在于当前实验仅基于单视角标准数据集,后续将探索其在多组学数据中的跨维度关联挖掘。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号