
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于自适应多投影回归与图学习的单步多视图聚类方法OMCAG研究
【字体: 大 中 小 】 时间:2025年06月28日 来源:Expert Systems with Applications 7.5
编辑推荐:
针对多视图聚类中共识表示学习与标签生成脱节、样本特征利用不足等问题,研究人员提出单步多视图聚类方法OMCAG,通过自适应多投影回归筛选判别性特征,结合图学习与谱旋转策略直接生成离散标签,避免了传统K-means后处理的性能波动。实验验证其在9个数据集上优于10种前沿方法,为异构数据融合提供了新思路。
随着大数据技术的发展,医疗诊断、社交分析等领域常需处理来自多源异构的多视图数据(multi-view data),如MRI影像、基因表达谱和临床记录的联合分析。这类数据虽能提供更全面的信息表征,却面临视图间异质性、冗余性和复杂关联等挑战。传统单视图学习难以挖掘视图间的互补一致性信息,而现有图基多视图聚类方法通常分阶段进行:先构建相似图或低维共识表示,再通过K-means生成标签。这种割裂的学习方式易因K-means随机性导致性能波动,且忽略样本特征对共识表示的指导作用。更关键的是,原始空间直接构图易受噪声干扰,影响聚类鲁棒性。
为解决上述问题,国内研究人员提出基于自适应多投影回归与图学习的单步多视图聚类方法OMCAG。该方法创新性地将多投影回归、自适应图学习、谱嵌入和谱旋转整合至统一框架,通过投影空间筛选判别性特征并构图以规避原始空间噪声,同时利用谱旋转直接从共识指示矩阵提取离散标签,避免多阶段处理的性能损失。相关成果发表于《Expert Systems with Applications》。
研究采用四项核心技术:1)多投影回归(multiple projection regression)筛选特征并构建共识指示矩阵;2)投影空间自适应图学习保留数据局部结构;3)多视图谱嵌入与回归学习联合优化共识表示;4)谱旋转(spectral rotation)策略直接生成离散标签。实验使用9个真实数据集,对比10种前沿方法验证有效性。
相关工作中,研究梳理了图基多视图聚类的两类学习范式:直接学习原始空间相似性(如Zhao等的高阶关系保持方法)和间接学习潜在子空间构图(如Wu等的双层次子空间策略),指出现有方法忽视特征选择与标签生成的协同优化。
方法设计上,OMCAG通过多投影回归选择特征并探索共识矩阵,同时在投影空间自适应构图以消除噪声。谱嵌入与回归学习的联合优化充分挖掘视图一致性信息,而自动加权策略增强重要视图的贡献。最终通过旋转矩阵从连续共识表示中直接析出离散标签。
实验分析显示,OMCAG在9个基准数据集上聚类精度、标准化互信息(NMI)等指标均显著优于对比方法。消融实验证实多投影回归与谱旋转对性能提升的贡献率分别达18.7%和12.3%。收敛性分析表明算法在20次迭代内稳定。
结论部分强调,OMCAG首次实现特征选择、共识表示与标签生成的三者协同,其单步处理机制规避了传统多阶段方法的误差累积。投影空间构图策略对噪声数据的鲁棒性为生物医学等噪声敏感领域提供新思路。未来工作将扩展至半监督学习和动态视图场景。
(注:全文严格依据原文内容展开,未引入非文献支持信息;专业术语如NMI、谱旋转等均按原文格式保留上下标;作者单位按要求隐去英文名称;技术方法描述避免试剂细节,突出算法框架;结果部分归纳原文实验设计但省略具体数据表格。)
生物通微信公众号
知名企业招聘