编辑推荐:
为解决伊朗马赞达兰省人类布鲁氏菌病(Human Brucellosis)防控需求,研究人员采用混合机器学习方法,结合元启发式算法优化特征选择与超参数。结果表明 SVR-TMGWO 模型性能最优,绘制的易感性地图识别出 68 个高风险区,为疾病防控提供科学依据。
布鲁氏菌病(Brucellosis)是由布鲁氏菌属细菌引发的人畜共患病,全球每年约有 160 万至 210 万例感染病例,在伊朗等中东国家尤为严重。该国马赞达兰省年均发病率达 19.91 例 / 10 万人,远超发达国家水平。由于防控体系薄弱、监测能力不足及社会经济因素制约,传统疾病地图绘制方法难以精准识别高风险区域,亟需更高效的建模工具以提升防控效率。
为此,国外研究机构的科研团队针对马赞达兰省开展了人类布鲁氏菌病易感性地图(HBSM)构建研究。团队以支持向量回归(SVR)为基础模型,创新性整合三种元启发式算法 —— 灰狼优化算法(GWO)、流向算法(FDA)和电鳗觅食优化算法(EEFO),同步实现特征选择与超参数调优,并引入转化函数降低计算复杂度,通过两阶段变异算子提升特征筛选性能。研究成果发表于《Acta Tropica》,为热带病防控领域提供了新的技术范式。
研究主要采用以下关键技术:①数据来源于 2012-2018 年马赞达兰省疫情记录,分为训练集(726 条)和测试集(121 条);②通过混合模型(SVR 与三种元启发式算法结合)进行特征子集筛选与超参数优化;③利用均方根误差(RMSE)、平均绝对误差(MAE)等指标评估模型性能;④基于最优模型生成 2018 年易感性地图。
结果
模型性能对比
通过对比发现,整合转化函数与两阶段变异算子的灰狼优化算法模型(SVR-TMGWO)表现最优,测试集指标为 RMSE=0.7723、MAE=0.614、MdAE=0.473、R=0.536,显著优于 FDA 和 EEFO 算法模型,验证了 GWO 在特征 - 超参数联合优化中的优势。
易感性地图绘制
基于 SVR-TMGWO 模型预测的 2018 年地图显示,马赞达兰省 68 个农村地区被划分为 “高” 和 “极高” 易感等级,这些区域主要分布于里海沿岸与阿尔博兹山脉周边,与当地畜牧业分布、地形湿度及人口密度高度相关。
讨论与结论
本研究首次在布鲁氏菌病建模中实现特征选择与超参数调优的同步优化,突破了传统机器学习分步调参的局限性。转化函数的引入使计算效率提升 30% 以上,两阶段变异算子则通过 “全局探索 - 局部开发” 机制避免特征筛选陷入局部最优。研究证实,GWO 算法在处理高维特征空间时具有更强的全局寻优能力,其筛选的关键特征(如牲畜密度、年均温、土壤湿度)与疾病传播机制高度吻合。
该研究构建的易感性地图为马赞达兰省提供了精准防控工具,决策者可依据风险等级分配资源,在高风险区加强牲畜检疫、推广无害化处理技术,并针对气候敏感区域开展预警监测。此外,研究提出的混合建模框架为其他 neglected zoonotic diseases(如皮肤利什曼病)的空间预测提供了方法论参考,推动了元启发式算法在公共卫生领域的应用拓展。
研究表明,机器学习与元启发式算法的深度融合能够显著提升疾病空间预测的精度与效率,为全球欠发达地区的传染病防控提供了可复制的技术路径。未来可进一步纳入实时监测数据,动态更新风险地图,以增强模型的时效性与决策支持价值。