基于图判别动态采样AdaBoost的心血管疾病不平衡数据诊断模型研究

【字体: 时间:2025年08月31日 来源:Expert Systems with Applications 7.5

编辑推荐:

  本文提出了一种新型心血管疾病(CVD)诊断模型GDDSAD(Graph Discriminative Dynamic Sampling AdaBoost),通过集成动态欠采样/过采样模块和改进的局部保持投影(LPP)算法,在AdaBoost框架中实现了类别平衡、特征提取和分类的联合优化。实验表明该模型在4个CVD数据集上G-Mean平均提升0.208,AUC提升0.111,为不平衡医疗数据分类提供了创新解决方案。

  

研究亮点

(1) 提出基于置信度的权重更新机制,将样本划分为简单、边界和困难三组,通过自适应策略重点优化边界样本;

(2) 创新性地在AdaBoost中集成聚类过采样和置信度欠采样模块,构建更精确的决策边界;

(3) 改进LPP算法,引入稀疏邻接图和判别项,为基学习器提供更具判别力的低维流形输入。

经典AdaBoost架构

AdaBoost作为经典Boosting算法,通过迭代过程中逐步增加误分类样本权重(最小化分类错误率ε),最终加权聚合多个基分类器形成强学习器。给定训练集T={(x1,y1),...,(xn,yn)},其中xi∈X?Rn,yi∈{-1,+1}。

实验设置

采用Python 3.12平台,基于scikit-learn 1.5.1实现GDDSAD算法,在AMD Ryzen 5 6600H硬件环境下完成所有实验验证。

结论

人工智能快速发展背景下,面对CVD数据集的类别不平衡和特征冗余挑战,本研究通过集成动态采样和流形学习技术,显著提升了模型对病理样本的识别能力(代码已开源在GitHub)。

利益声明

作者声明不存在可能影响研究结果的财务或个人利益冲突。

致谢

感谢匿名评审专家的宝贵意见,本研究受国家自然科学基金(12101138)和国家级大学生创新创业训练计划(202510566026)资助。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号