
-
生物通官微
陪你抓住生命科技
跳动的脉搏
机器学习模型预测牡蛎中副溶血弧菌浓度的比较研究与公共卫生应用
【字体: 大 中 小 】 时间:2025年06月13日 来源:Microbial Risk Analysis 3.0
编辑推荐:
为解决牡蛎中副溶血弧菌(Vibrio parahaemolyticus)污染引发的食源性疾病风险,研究人员系统评估了14种机器学习模型(如Elastic Net、XGBoost等)的预测性能,发现5种高效模型(CCC>0.9)可精准量化环境因子(如SST、风速)与菌浓度的非线性关系,为贝类安全监测提供智能化工具。
随着生食牡蛎的消费量激增,由副溶血弧菌(Vibrio parahaemolyticus)引发的胃肠炎疫情在全球多地频发。这种嗜盐性病原体通过滤食性贝类富集,其携带的毒力基因可导致从轻微腹泻到需住院治疗的严重症状,对免疫低下人群尤为危险。传统预测方法依赖线性模型,难以捕捉海表温度(SST)、风速等环境因子与菌群动态间的复杂非线性关系,制约了预警系统的准确性。
为解决这一难题,国家研究创新署与科技部资助的研究团队系统比较了14种机器学习(ML)算法对牡蛎副溶血弧菌浓度的预测效能。研究基于台湾两处养殖场2019-2020年的月度监测数据,整合菌浓度(MPN/g)与同步环境参数,通过Most Probable Number-PCR(MPN-PCR)法定量病原体负荷。
关键技术包括:1) 采用Concordance Correlation Coefficient(CCC)评估模型精度;2) 通过变量重要性分析(Variable Importance Analysis)和部分依赖图(Partial Dependence Plots, PDPs)解析环境驱动机制;3) 比较从K最近邻(KNN)到装袋回归树(bag-RPart)等算法的计算效率。
模型性能与计算效率
所有模型(除CART外)训练集CCC>0.85,测试集达>0.9(装袋多元自适应回归样条bag-MARS除外)。Elastic Net(EN)、随机森林(RF)、XGBoost、轻量梯度提升机(L-GBM)和Cubist五大优选模型兼具高精度(CCC 0.91-0.93)与合理耗时(39-92分钟),显著优于耗时最长的bag-RPart(162分钟)。
环境驱动机制
PDP分析揭示:1) SST在16-26°C区间显著促进菌增殖,呈现倒U型响应;2) 风速>4 m/s抑制生长而>6 m/s则可能通过水体混合作用促进扩散;3) 盐度>19 ppm与pH 7.5-7.7构成适宜生态位;4) 滞后变量SST_imX_25等证实环境影响的时滞效应。
讨论与结论
该研究首次系统比较ML模型在副溶血弧菌预测中的适用性,证实集成算法能有效捕捉温度阈值与非线性交互作用。优选模型工具包可整合至实时监测系统,指导基于SST预警的采收管制。研究同时揭示风速的双相作用机制,为解释不同海域疫情差异提供新视角。成果发表于《Microbial Risk Analysis》,为气候变化背景下贝类安全管理的精准决策提供方法论支撑。
生物通微信公众号
知名企业招聘