
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于精细化张量学习的无参数多视图聚类方法及其在生物信息学中的应用
【字体: 大 中 小 】 时间:2025年09月11日 来源:Neurocomputing 6.5
编辑推荐:
本文提出了一种创新的无参数多视图聚类框架PRTL(Parameter-free Multi-view Clustering via Refined Tensor Learning),通过双向回归矩阵实现数据重构与特征提取,结合二次衰减张量(Quadratic Decay Tensor, QDT)正则化实现自适应低秩约束,并引入超拉普拉斯图(hyper-Laplace graph)捕捉复杂样本关系。该方法无需人工调参,在多个数据集上显著优于现有技术,为多模态生物数据挖掘提供了高效解决方案。
Highlight
本研究提出了一种突破性的无参数多视图聚类(MVC)框架PRTL,其核心创新在于:
1)通过双向(样本空间与特征空间)线性回归重构数据,显著提升特征判别力;
2)首次设计二次衰减张量(QDT)作为非凸正则化项,根据奇异值的信息贡献度实现自适应收缩(如较大奇异值保留更多信息),克服传统张量范数(如TNN)的均等收缩缺陷;
3)引入超拉普拉斯图约束,捕获超越传统成对图的高阶样本关系;
4)整个模型无需超参数调优,具备强鲁棒性与跨数据集泛化能力。
Methodology
本部分详细阐述了PRTL的双向重构建模与QDT张量范数设计:
双向回归矩阵分别从行空间与列空间重构数据,提取具有判别性的 salient features(显著特征)
QDT通过二次衰减函数动态调整奇异值收缩比率,其数学形式为:
R(X)=∑i1+ασi2σi
其中σi为奇异值,α为自适应衰减系数,重要奇异值得以保留而噪声被抑制
超拉普拉斯图构建基于k近邻的相似性矩阵,捕捉多元样本关联
Optimization
采用拉格朗日乘子法与交替方向最小化(ADM)算法求解模型,并分析了计算复杂度为O(n3)(n为样本数),实验证明算法在10次迭代内收敛。
Experiments
在9个多视图数据集(包括人脸、基因表达谱等生物医学数据)上验证有效性:
聚类精度(ACC)平均提升5.2%,NMI指标提升4.8%
可视化显示PRTL能突出关键生物特征(如人脸图像中的眼部区域)
消融实验证实QDT与超图约束的贡献率分别为38%和22%
Conclusion
PRTL通过双向重构、QDT自适应张量约束与超图建模,实现了无需参数调优的高效多视图聚类,在生物医学多模态数据整合中具有显著优势。未来将拓展至单细胞多组学数据整合领域。
生物通微信公众号
知名企业招聘