一种改进的两阶段二元相关性方法,用于多标签分类

《Journal of Applied Statistics》:An improved two-stage binary relevance method for multilabel classification

【字体: 时间:2025年10月06日 来源:Journal of Applied Statistics 1.1

编辑推荐:

  提出一种改进的两阶段二进制相关方法,通过聚类分析揭示标签关联性,分阶段预测标签子集和单个标签,缓解标签不平衡问题。实验表明该方法在10个真实数据集上显著优于或相当于是二进制相关法及3种其他方法。

  

摘要

多标签分类是一类非传统的分类问题,其中每个实例可能同时关联多个标签。传统的多标签分类方法之一是二元相关性算法(binary relevance algorithm),该方法首先将多标签数据集转换为多个二元输出数据集(每个标签对应一个数据集),然后在每个转换后的数据集上训练二元分类器来预测相应标签的出现情况,最后将所有预测的标签汇总起来形成最终的多标签结果。这种方法的两个主要缺点是:无法考虑标签之间的关联性,且在标签分布稀疏时预测性能较差。为了解决这些问题,我们开发了一种改进的两阶段二元相关性算法,该方法利用聚类分析来揭示标签之间的内在结构,并依次进行标签子集和单个标签的预测。为了解决标签子集不平衡带来的挑战,我们对所提出的方法进行了多种优化改进。我们在十个真实的多标签数据集上对该方法进行了测试,并使用五种不同的性能指标将其与基准的二元相关性算法以及其他三种竞争方法进行了比较。数值结果表明,在几乎所有情况下,该方法都能获得显著更好或相当的结果。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号