
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于深度学习和图表示的高维数据特征选择方法创新研究
【字体: 大 中 小 】 时间:2025年08月27日 来源:Knowledge-Based Systems 7.6
编辑推荐:
【编辑推荐】本文提出了一种基于深度学习(Deep Learning)和图表示(Graph Representation)的新型特征选择方法,通过深度相似性度量(Deep Similarity Measure)构建特征图,结合社区检测(Community Detection)和节点中心性(Node Centrality)技术,有效解决了高维数据中冗余特征筛选难题。相比传统过滤式(Filter)和封装式(Wrapper)方法,该方案计算效率提升显著,平均准确率提高1.5%,为基因组学、金融等高维领域提供新思路。
亮点
• 提出创新的深度学习框架构建特征空间图表示,通过深度相似性度量显著提升特征选择效率(详见第4章表12对比实验)。
• 全自动确定聚类数量和特征子集,突破传统方法需人工预设参数的限制。
• 采用节点中心性(Node Centrality)驱动的社区检测技术,规避k均值(k-means)等传统聚类方法在高维数据中的局部最优陷阱。
• 创新性融合特征簇内分布与跨簇连接性分析,实现更精准的特征筛选。
结论
本文开发的深度图表示特征选择模型,通过深度相似性度量构建初始特征图,结合社区检测与节点中心性技术,不仅自动优化聚类数量,还在多个高维数据集测试中展现出优越性能。相比现有技术,该方法在保持低计算复杂度的同时,平均准确率提升1.5%,精确度(Precision)、召回率(Recall)和F1值分别提高1.77%、1.87%和1.81%,为高维生物医学数据挖掘提供了新范式。
(注:根据要求已去除文献引用标识,专业术语保留英文缩写并规范标注上下标)
生物通微信公众号
知名企业招聘