
-
生物通官微
陪你抓住生命科技
跳动的脉搏
非线性非负矩阵分解多视图聚类框架N3MF:融合深度学习可解释性与鲁棒性的创新方法
【字体: 大 中 小 】 时间:2025年06月26日 来源:Neural Networks 6.0
编辑推荐:
针对传统非负矩阵分解(NMF)方法非线性拟合能力不足、参数空间受限,以及深度多视图聚类模型可解释性差、小规模数据稳定性差等问题,研究人员提出非线性NMF多视图聚类框架N3MF。该模型通过部分参数化网络层融合NMF迭代过程,结合跨视图对比损失,在四个数据集上实现最优聚类性能,尤其在小规模数据中优势显著,为平衡模型可解释性与学习灵活性提供新范式。
在机器学习领域,多视图聚类(MVC)因其能整合不同视角数据的一致性互补信息而备受关注。然而现有方法面临两难困境:传统非负矩阵分解(NMF)方法虽具数学可解释性,却受限于线性假设和狭窄参数空间;深度学习方法虽具备强大表征能力,但其"黑箱"特性导致更新过程不可控,且在小规模数据上易出现过拟合。这种矛盾在医疗影像分析、跨模态生物数据整合等场景尤为突出——既需要模型捕捉复杂非线性关系,又要求决策过程透明可靠。
为破解这一难题,华南理工大学的研究团队在《Neural Networks》发表研究,提出非线性非负矩阵分解多视图聚类框架N3MF。该工作创造性采用"部分参数化"策略:保留NMF矩阵分解的数学框架确保可解释性,通过神经网络层实现非线性映射;设计跨视图对比损失函数强制学习视图间多样性;将传统迭代过程嵌入深度网络,使模型既能处理大规模数据深层语义,又能适应小规模数据的稳定训练。实验证明该方法在Caltech-101等数据集上ACC指标提升3.2%-8.7%,NMI提高4.5%-9.3%,特别是在样本量<1000时优势更显著。
关键技术包括:1) 构建部分参数化网络层实现NMF可微迭代;2) 设计基于InfoNCE的跨视图对比损失函数;3) 采用交替优化策略平衡视图特异性与一致性;4) 在BBCSport等4个标准多视图数据集验证性能。
【Method】
非线性网络框架:通过引入ReLU激活函数的可学习投影矩阵,将传统NMF目标函数转化为深度网络层,实现低维流形空间到高维特征空间的非线性映射。实验显示该设计使ORL数据集上的聚类准确率较传统NMF提升19.8%。
【Experiments】
小规模数据优势:在样本量仅240的BBCSport数据集上,N3MF的ACC达0.892,显著优于对比方法DMVC-UD(0.827)和OPMC(0.804),证实其参数空间设计的合理性。
【Model analysis】
可解释性验证:通过可视化因子矩阵发现,网络自动学习的基向量能对应数据物理特征(如人脸图像的局部器官),这与传统NMF的部件表征特性一致,但具有更丰富的层次结构。
该研究开创性地在深度学习中保留数学优化原理,为医疗多模态数据融合、跨平台生物标记物发现等需要可解释模型的场景提供新工具。其部分参数化思想对平衡模型复杂度与泛化能力具有普适启示,被审稿人评价为"在深度学习可解释性方向的重要探索"。未来可扩展至张量分解等更多传统优化方法与深度学习的融合研究。