
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于马修斯相关系数的递归集成特征选择方法在高维小样本数据中的特征排序研究
【字体: 大 中 小 】 时间:2025年10月26日 来源:Machine Learning with Applications 4.9
编辑推荐:
本文推荐介绍了一种针对高维小样本(HDLSS)组学数据中类别不平衡和可重复性挑战的解决方案。研究人员开发了MCC-REFS方法,将马修斯相关系数(MCC)作为特征选择指标集成到递归集成特征选择(REFS)框架中。该方法利用八种机器学习分类器,无需预定义特征数量或复杂超参数调优。在合成和真实数据集上的测试表明,MCC-REFS能选择更紧凑、信息量更大的特征集,获得更高或相当的分类性能,尤其在TCGA多标签乳腺癌数据集中表现出色。该研究为基于组学的诊断和预后应用提供了稳健、可扩展的特征选择工具。
生物通微信公众号
知名企业招聘