基于多目标混合Harris Hawk优化的特征选择与疾病诊断推荐系统研究

【字体: 时间:2025年05月27日 来源:Healthcare Analytics CS4.4

编辑推荐:

  为解决医疗数据高维特征选择难题,研究人员创新性地提出融合遗传算法(GA)与Harris Hawk优化(HHO)的多目标混合模型(MOGAHHO),结合TPOT自动化机器学习工具构建健康推荐系统(HRS)。该研究实现了疾病关键致病因素的精准筛选(TOP-3推荐准确率提升67%)和最优诊断模型推荐(分类准确率最高达94%),相比PCA/SVD等传统方法显著提升预测性能,为智能医疗决策提供了新范式。

  

在医疗大数据时代,如何从海量临床特征中精准识别关键致病因子,一直是智能医疗领域的核心挑战。传统推荐系统(RS)虽在电商领域大放异彩,但应用于医疗场景时面临特征冗余、模型泛化能力不足等瓶颈。现有方法如主成分分析(PCA)和自编码器虽能降维,却无法解释特征重要性;而单一优化算法如遗传算法(GA)易陷入局部最优。这些缺陷导致现有医疗推荐系统在准确性和可解释性上难以满足临床需求。

为突破这些限制,国内某研究机构团队在《Healthcare Analytics》发表创新研究,提出基于多目标混合Harris Hawk优化(MOGAHHO)的健康推荐系统。该研究巧妙融合GA的全局搜索能力和HHO的动态逃逸能量机制,通过Pareto支配原则平衡特征数量最小化与分类精度最大化的矛盾,最终实现疾病关键特征的智能筛选与诊断模型的一站式推荐。

研究采用三大关键技术:1) 混合MOGAHHO算法进行特征选择,种群前50%执行GA的交叉变异,后50%依据猎物逃逸能量公式EPrey=2EInitial(1-C/M)动态切换HHO的探索与开发模式;2) TOPSIS多准则决策对特征进行三维评估(特征间相关性、类内相关性、出现频次);3) TPOT自动化机器学习自动优化模型管道,从Scikit-learn库中筛选最佳分类器。

研究结果
3.1 特征选择性能突破
MOGAHHO在10个医疗数据集测试中,以平均7.01秒的运行时间显著优于MOGA(8.87秒)和MOHHO(8.45秒)。在乳腺癌数据集上实现94%的平衡精度(BA),特征数从9个压缩至4个,马修斯相关系数(MCC)达0.842。

3.2 模型推荐优势
相比传统降维方法,特征选择后的TPOT模型推荐准确率全面提升。以心脏病数据集为例,MOGAHHO+TPOT推荐的ExtraTree分类器使BA从0.84升至0.88,而PCA方法仅达0.86。关键发现:当猎物能量|EPrey|<1时,HHO的局部搜索能力可有效提升特征子集质量。

3.3 TOP-3特征推荐
通过TOPSIS加权标准化决策矩阵(权重W=0.333),系统成功识别关键临床指标。如COVID-19患者年龄分位数(Patient Age Quantile)和淋巴细胞(Lymphocytes)被确认为核心预测因子,推荐精准度达100%,较传统RFSCORT方法提升67%。

结论与展望
该研究开创性地将生态捕食行为启发算法应用于医疗特征选择,通过MOGAHHO的混合优化策略解决了多目标冲突问题。临床意义显著:1) 为每种疾病推荐≤8个关键特征,降低检测成本;2) 自动化模型推荐缩短诊断流程,如MLP分类器使皮肤病诊断BA达0.90;3) 特征重要性排序助力病因学研究,如发现宫颈癌中Dx:HPV的决策权重最高。未来可扩展至多模态医疗数据融合,并探索与其他元启发式算法的协同效应。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号