《Parasitology International》:Leveraging machine learning for predicting
Opisthorchis viverrini infection in cats: A tool for veterinary epidemiology
编辑推荐:
本研究利用机器学习模型预测猫肝吸虫病感染,识别出居住于洪水区域、喂食鱼碎和年降雨量是主要风险因素,为针对性防控提供科学依据。
佩查拉特·乔姆波(Petcharat Chompo)|维拉萨克·普尼亚波恩威塔亚(Veerasak Punyapornwithaya)|班乔布·斯里帕(Banchob Sripa)|西里卡乔恩·唐卡瓦塔纳(Sirikachorn Tangkawattana)
泰国孔敬大学(Khon Kaen University)兽医学院
摘要
Opisthorchis viverrini(Ov)感染是大湄公河次区域面临的主要公共卫生问题,猫是该病毒的主要宿主。尽管机器学习(ML)在人类医学中得到了广泛应用,但在兽医流行病学中的应用仍然有限。本研究旨在利用来自流行地区175个家庭的数据,开发可解释的机器学习模型来预测Ov感染,并确定猫的关键风险因素。研究人员通过特征选择、超参数调整和SMOTE方法优化了五种机器学习算法——分类树(Classification Tree)、随机森林(Random Forest)、岭逻辑回归(Ridge Logistic Regression, Ridge LR)、极端梯度提升(Extreme Gradient Boosting)和支持向量机(Support Vector Machine, SVM)。结果表明,采用最小冗余最大相关性(mRMR)方法的岭逻辑回归、经过调整的岭逻辑回归以及经过调整的支持向量机均表现出可靠的性能,其ROC-AUC值超过0.7。具体而言,未经调整的岭逻辑回归的平衡准确率为0.722,而经过调整的岭逻辑回归的敏感性最高(0.667)。经过调整的支持向量机在mRMR方法下的测试ROC-AUC值为0.723,PR-AUC值为0.473,平衡准确率为0.682。Shapley加性解释(SHAP)分析确定了关键风险因素,包括居住在洪水泛滥地区、给猫喂食鱼残渣以及年降雨量,这凸显了环境因素在Ov传播中的作用。这些发现表明了机器学习在兽医流行病学中的潜力,并强调了根据数据特征选择合适方法的重要性。研究表明,针对这些关键风险因素的针对性、基于风险的干预措施对于有效控制流行地区的Ov感染至关重要。