利用基于离散Levy飞行模型的灰狼优化器随机森林算法,处理甲状腺超声和糖尿病视网膜病变数据集中的不平衡问题和数据缺失问题,以实现鲁棒的医学数据分类
《ACM Transactions on Asian and Low-Resource Language Information Processing》:Handling Imbalance and Limited Data in Thyroid Ultrasound and Diabetic Retinopathy Datasets Using Discrete Levy Flights Grey Wolf Optimizer Based Random Forest for Robust Medical Data Classification
【字体:
大
中
小
】
时间:2025年11月08日
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
编辑推荐:
医学图像分类中,基于离散莱维飞行灰狼优化的随机森林模型(DLFGWO-RF)通过灰狼群智能优化特征选择和参数调整,有效解决数据不平衡、图像质量差异及标注不一致问题,在糖尿病视网膜病变分级中实现90-95%的分类准确率,并降低专家标注需求。
摘要
在疾病诊断领域,医学图像分类面临着诸多固有挑战,这些挑战源于数据不平衡、图像质量波动、注释差异以及数据可用性和代表性的限制。这些因素会对算法对医学图像的分类能力产生不利影响,导致模型结果存在偏差和解释不准确。本文提出了一种新颖的离散Levy飞行灰狼优化器(DLFGWO),并将其与随机森林(RF)分类器结合,以克服生物医学数据集中的上述问题并提高分类效率。DLFGWO-RF能够处理超声图像中的质量波动,并通过处理不完整和噪声数据来减少分类错误。过度关注多数类别可能导致类别分布不均,从而引发数据不平衡。DLFGWO利用灰狼的探索与利用能力(通过离散Levy飞行算法实现),平衡了类别分布,进一步提升了分类器的性能,实现了更均衡的分类结果。该算法即使在数据量有限的情况下也能有效进行分类,从而减少了对外部专家注释的依赖。在糖尿病视网膜病变分级任务中,DLFGWO-RF通过主观解释减少了注释之间的分歧。然而,糖尿病视网膜病变数据集的代表性不足,无法全面反映人群的多样性,这限制了该模型的泛化能力。因此,对RF进行微调可以帮助其更好地适应数据集中的子群体,从而提升整体性能。实验在两个常用的医学图像数据集上进行了验证,结果表明DLFGWO-RF的分类准确率提高了90-95%,优于现有的不平衡数据集处理技术。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号