
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于K均值图变换器的部分多标签学习:噪声标签消歧与互补信息挖掘
【字体: 大 中 小 】 时间:2025年07月03日 来源:Knowledge-Based Systems 7.2
编辑推荐:
针对部分多标签学习(PML)中候选标签含噪声导致模型性能下降的问题,研究人员提出PML-KGT框架,通过K均值聚类中心学习和图结构设计挖掘标签互补信息,结合新型校正损失函数实现标签消歧。实验表明该方法显著提升噪声环境下的分类性能,为弱监督学习提供新思路。
在人工智能的浪潮中,弱监督学习正成为解决数据标注难题的关键技术。其中,部分多标签学习(Partial Multi-Label Learning, PML)尤其引人注目——它要求模型从包含噪声标签的候选集中识别真实标签,就像从混杂着赝品的古董堆里鉴别真品。这种场景在众包图像标注、医疗报告自动编码等实际应用中比比皆是。然而,现有方法要么依赖不切实际的强先验假设,要么忽视标签间的互补信息,导致模型在真实噪声环境中表现不佳。
针对这一挑战,中国的研究团队在《Knowledge-Based Systems》发表创新成果,提出名为PML-KGT的新型框架。该方法巧妙融合K均值聚类思想与图注意力机制,通过两阶段迭代学习实现标签消歧:第一阶段利用图结构挖掘相似实例间的标签互补信息,动态更新聚类中心;第二阶段通过校正损失函数优化分类器,形成自我强化的学习闭环。实验证明,该方法在合成和真实数据集上均显著超越现有技术,为处理复杂噪声标签提供了可解释的解决方案。
关键技术包括:1) 基于图注意力网络构建实例-标签关系模型;2) 可学习参数驱动的动态聚类中心更新机制;3) 融合聚类中心相关性的标签权重校正损失函数。研究采用标准PML数据集评估性能,对比7种前沿方法进行验证。
相关工作中,作者系统梳理了PML与多标签学习(MLL)、部分标签学习(PLL)的理论关联,指出当前非深度学习方法(NDLS)依赖强假设的局限,以及深度学习方法(DLS)忽视标签空间噪声的缺陷。
问题建模部分明确定义PML的数学形式:给定特征空间X∈Rd和标签空间Y={yc}c=1Q,训练集D={(xi,Yi)|Yi∈{0,1}Q}包含N个实例,其中每个Yi是可能含噪声的候选标签集。
实验环节通过消融研究验证了各模块贡献,结果显示:1) 图结构设计使噪声标签识别准确率提升18.7%;2) 动态聚类中心机制较传统K均值提高F1值12.3%;3) 校正损失函数有效降低假阳性率。
结论部分强调该研究的三大创新:1) 首创融合聚类中心与图结构的PML框架;2) 开发基于注意力机制的标签互补信息挖掘方法;3) 提出可动态调整标签权重的损失函数。这些突破不仅推动弱监督学习理论发展,更为医学图像分析、自动化标注等实际应用提供新工具。
研究获得国家自然科学基金(62401309)、山东省自然科学基金(ZR2024QF119)和青岛市科技计划(24-4-4-zrjj-89-jch)支持,彰显其学术价值与应用潜力。这项工作犹如为噪声标签的迷宫点亮了指路明灯,为构建更鲁棒的智能系统开辟了新路径。
生物通微信公众号
知名企业招聘