用于微阵列数据分类的集成特征选择

《IEEE Journal of Biomedical and Health Informatics》:Ensemble Feature Selection for Microarray Data Classification

【字体: 时间:2025年11月22日 来源:IEEE Journal of Biomedical and Health Informatics 6.8

编辑推荐:

  微阵列数据分类面临高维和小样本问题导致特征选择不稳定,传统集成方法平衡多样性及质量不足。本文提出EFSM方法,通过随机神经网络生成多视角特征映射,构建候选特征选择器池,并建立半定规划优化模型联合优化预测精度和特征器多样性,最终采用Borda计数法聚合排名。实验表明EFSM在15个生物数据集上优于9种SOTA方法,具有更优的高维数据稳定性。

  

摘要:

微阵列数据分类面临高维度和小样本量的挑战,这导致特征选择变得不稳定。传统的集成特征选择方法难以有效平衡多样性和质量。我们提出了一种新颖的集成特征选择方法(EFSM),该方法引入了一种特征映射多样性度量来生成一个稳健的候选特征集。EFSM首先利用随机神经网络创建原始数据的多个非线性特征映射(视图),从而生成一个多样化的特征选择器候选集。其核心创新在于一种集成剪枝技术,该技术被构建为一个优化问题,旨在同时最大化各个特征选择器的预测准确性和它们之间的多样性。我们通过将这个NP难问题转化为半定规划(SDP)问题,并推导出一种高效的解决方案界限来简化该问题。最后,使用Borda计数方法对剪枝后的集成结果进行排序。在15个生物数据集上的广泛实验表明,EFSM在多种流行的分类器上均优于九种最先进的特征选择方法,为高维数据分析提供了卓越且稳定的性能。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号