
-
生物通官微
陪你抓住生命科技
跳动的脉搏
机器学习模型在预测尼日利亚疟疾流行率中的应用:基于2015–2020年人口与健康调查数据的分析
《Journal of Parasitic Diseases》:Application of machine learning models in predicting malaria prevalence in Nigeria: an analysis of the 2015–2020 demographic and health surveys
【字体: 大 中 小 】 时间:2025年10月29日 来源:Journal of Parasitic Diseases
编辑推荐:
本研究利用机器学习模型结合低成本诊断工具,基于尼日利亚2020年人口健康调查数据,通过回归算法预测疟疾风险,验证显示模型表现优异(RFR系数0.9937),有助于精准资源分配和干预。
疟疾是一个重大的公共卫生问题,尤其是在撒哈拉以南非洲和其他发展中国家,这些地区占据了大多数疟疾病例和死亡病例。本研究开发了一种机器学习(ML)模型,利用患者的症状和其他临床信息,通过低成本且易于获取的诊断工具,在尼日利亚的农村社区中准确诊断疟疾。该模型基于2020年尼日利亚人口与健康调查项目的地理空间协变量数据集进行训练,该数据集包含了尼日利亚患者的临床信息。与传统统计方法相比,机器学习方法更受青睐,因为它们能够处理高维数据、非线性关系以及多种变量之间的相互作用。基于回归的算法被用来识别和预测连续性的结果,从而提供比二元分类更细致的空间和人口统计洞察。模型通过交叉验证和保留测试进行了严格的验证,以评估其泛化能力并减少过拟合现象。预测的疟疾发病率与实际发病率之间的高度吻合表明了该机器学习模型的稳健性。随机森林回归器(RFR)、多元线性回归和岭回归模型的系数确定分数分别为0.9937、0.9916和0.9924(针对测试集),这证明了这些模型的预测能力。RFR模型的学习曲线显示出了一个重复出现的模式。随着数据量的增加,模型在测试数据集上的表现持续提升。通过从被动诊断转向主动风险预测,卫生部门可以更有效地分配资源、优化干预时机,并精准地覆盖服务不足的农村社区。
疟疾是一个重大的公共卫生问题,尤其是在撒哈拉以南非洲和其他发展中国家,这些地区占据了大多数疟疾病例和死亡病例。本研究开发了一种机器学习(ML)模型,利用患者的症状和其他临床信息,通过低成本且易于获取的诊断工具,在尼日利亚的农村社区中准确诊断疟疾。该模型基于2020年尼日利亚人口与健康调查项目的地理空间协变量数据集进行训练,该数据集包含了尼日利亚患者的临床信息。与传统统计方法相比,机器学习方法更受青睐,因为它们能够处理高维数据、非线性关系以及多种变量之间的相互作用。基于回归的算法被用来识别和预测连续性的结果,从而提供比二元分类更细致的空间和人口统计洞察。模型通过交叉验证和保留测试进行了严格的验证,以评估其泛化能力并减少过拟合现象。预测的疟疾发病率与实际发病率之间的高度吻合表明了该机器学习模型的稳健性。随机森林回归器(RFR)、多元线性回归和岭回归模型的系数确定分数分别为0.9937、0.9916和0.9924(针对测试集),这证明了这些模型的预测能力。RFR模型的学习曲线显示出了一个重复出现的模式。随着数据量的增加,模型在测试数据集上的表现持续提升。通过从被动诊断转向主动风险预测,卫生部门可以更有效地分配资源、优化干预时机,并精准地覆盖服务不足的农村社区。