编辑推荐:
数据聚类在图像处理等领域至关重要,传统技术存在初始化敏感等局限。研究人员提出增强海象优化算法(IWO),融合对立学习(OBL)和变异搜索策略(MSS)。实验表明 IWO 性能优于 PSO 等算法,为复杂聚类问题提供新框架。
在数据爆炸式增长的时代,数据聚类作为机器学习和数据分析的核心技术,如同一位精准的 “数据分拣师”,在图像处理、医疗诊断、生物信息学等领域承担着将复杂数据分门别类的重任。然而,传统聚类方法如 k-means、模糊 c 均值等,如同戴着枷锁的舞者,受困于对初始位置敏感、易陷入局部最优、收敛性能差等难题,在面对高维、多模态数据时常常力不从心。如何让聚类算法在复杂的数据迷宫中精准找到最优解,成为困扰研究者的一大挑战。为了突破这一瓶颈,来自相关领域的研究人员展开了对优化算法的深入探索,试图为数据聚类装上更强大的 “导航系统”。
在这样的背景下,一项发表在《Array》的研究应运而生。研究人员聚焦于海象优化算法(Walrus Optimizer, WO)的改进,提出了一种融合对立学习(Opposition-Based Learning, OBL)和变异搜索策略(Mutation Search Strategy, MSS)的增强海象优化算法(Improved Walrus Optimizer, IWO),旨在提升算法在数据聚类中的探索和开发能力,解决传统方法的局限性。
研究人员采用了多种关键技术方法来验证 IWO 的性能。首先,在基准函数测试中,选取了包括单峰和多峰函数在内的多种测试函数,对比了 IWO 与粒子群优化算法(PSO)、灰狼优化算法(GWO)、非洲秃鹫优化算法(AVOA)等多种元启发式算法。其次,在数据聚类实验中,使用了 UCI 存储库中的多个数据集,如乳腺癌、避孕药选择、玻璃识别等,涵盖不同特征、实例和分类数,全面评估算法的鲁棒性和适应性。
实验结果与分析
基准函数测试结果
在基准函数实验中,IWO 展现出了卓越的性能。通过与 AOA、PSO、GWO 等算法的对比发现,IWO 在大多数测试函数中收敛速度更快,能更稳定地找到全局最优解。例如,在单峰函数 F1(Sphere)和多峰函数 F5(Rastrigin)等测试中,IWO 的最佳值、平均值和标准差均优于其他算法,证明了其在不同类型问题中的高效性和稳定性。统计分析如 p 值和排名分数进一步验证了 IWO 的优越性,表明其性能提升并非偶然。
数据聚类问题结果
在数据聚类实验中,研究人员选取了乳腺癌、CMC、玻璃识别等 8 个 UCI 数据集。结果显示,IWO 在多个数据集上表现出色。以乳腺癌数据集为例,IWO 的平均聚类误差低于其他算法,展现出在复杂医疗数据中精准分类的能力;在玻璃识别数据集这种对精度要求极高的场景中,IWO 即使在最坏情况下也能保持良好的聚类效果,证明了其适应性和可靠性。此外,在鸢尾花数据集等简单场景中,IWO 也能轻松实现高效聚类,凸显了其在不同复杂度数据中的普适性。
收敛行为分析
通过对比 IWO 与其他算法的收敛曲线发现,IWO 在早期能通过对立学习快速扩展搜索范围,探索数据空间的不同区域;在后期则通过变异策略精细调整解的位置,增强开发能力,避免陷入局部最优。这种独特的机制使其在处理多模态函数时,能有效平衡探索与开发,相较于 WO 等传统算法,显著提升了收敛速度和精度。
研究结论与意义
这项研究通过将对立学习和变异搜索策略引入海象优化算法,成功开发出高效的 IWO 算法。实验结果表明,IWO 在基准函数和实际数据集上均优于多种主流元启发式算法,为数据聚类提供了一种鲁棒且灵活的新框架。其意义不仅在于提升了聚类的准确性和稳定性,更在于为解决高维、复杂数据的聚类问题提供了新的思路和方法,在生物医学数据分析、图像识别等领域具有广阔的应用前景。未来,研究人员可进一步探索 IWO 与深度学习的结合,以及并行实现以提升其可扩展性,推动该算法在更多实际场景中的应用。