
-
生物通官微
陪你抓住生命科技
跳动的脉搏
面向无监督异构群组流特征选择的动态密度聚类优化方法
【字体: 大 中 小 】 时间:2025年08月19日 来源:Pattern Recognition 7.6
编辑推荐:
这篇研究提出了一种新型在线无监督异构群组流特征选择方法UHGSFS(Unsupervised Heterogeneous Group Streaming Feature Selection),通过最大信息系数(MIC)和基于高斯核函数的密度聚类,解决了特征类型未知、数据无标注、特征动态生成的三大挑战。实验表明其性能媲美甚至超越有监督流特征选择方法,为医疗诊断(如X光/心电图多模态数据实时处理)等场景提供了高效解决方案。
亮点
• 我们聚焦在线无监督异构流特征选择这一新实际问题,其特征以群组形式动态生成且类型未知。相比现有理想化设定,本研究更贴近真实场景。
• 提出基于密度聚类的在线无监督异构群组流特征选择方法UHGSFS:通过MIC评估特征关联性(无需预设分布),利用高斯核函数计算特征密度,并设计自适应聚类策略实现冗余最小化。该方法无需参数预设,可处理任意特征类型。
• 在13个基准数据集上的实验表明,在无标签且特征类型未知条件下,新方法性能与有监督流特征选择算法相当甚至更优。
创新性
本研究有两大突破:1)首次实现特征类型未知的异构流特征在线选择;2)基于自然邻居搜索的自适应聚类算法,无需预设参数,可应对任意数据类型。
结论与讨论
本文解决了异构流特征在类型未知时的在线无监督选择难题。通过MIC和高斯核密度聚类技术,提出的UHGSFS方法在医疗多模态数据(如X光影像、心电信号)等场景中展现出强大适应性。实验验证其性能媲美有监督方法,为实时诊断系统提供了新工具。
作者贡献声明
彭周:综述编辑/方法学设计/形式化分析;陈倩珍:算法实现/初稿撰写;桑磊:资金支持;赵舒:监督指导;吴信东:项目管理。
利益冲突声明
作者声明无潜在竞争性利益。
致谢
本研究获中国国家自然科学基金(62376001, 62206002, 62120106008)和安徽省自然科学基金(2308085MF215)资助。
生物通微信公众号
知名企业招聘