机器学习助力预测正痘病毒宿主,为公共卫生防控 “排雷”

【字体: 时间:2025年02月27日 来源:Communications Biology 5.2

编辑推荐:

  为预测正痘病毒(OPVs)潜在宿主,华盛顿州立大学研究人员整合宿主与病毒特征建模,明确宿主分布热点,对防控意义重大。

  正痘病毒(Orthopoxviruses,OPVs)在人类历史上留下了浓墨重彩的一笔,其中天花病毒曾引发全球范围内灾难性的疫情,夺走无数生命。不过,天花疫苗的出现成功助力人类根除了天花这一恶疾。但随着天花疫苗接种的停止,全球人群对正痘病毒的免疫力也随之下降。然而,正痘病毒家族多样,许多成员仍在动物宿主中传播,时不时引发人畜共患病,给防控工作带来极大挑战。例如,猴痘病毒近年来的全球传播,以及新型的北极痘病毒(borealpox virus)的出现,都让人们意识到,准确识别正痘病毒的动物宿主迫在眉睫。
为了解决这一难题,华盛顿州立大学的研究人员开展了一项极具意义的研究。他们的研究成果发表在《Communications Biology》期刊上,为正痘病毒的防控提供了新的方向和思路。
在这项研究中,研究人员运用了多种关键技术方法。首先,他们从多个公开数据库获取数据,构建了包含宿主与病毒信息的数据集。然后,利用主成分分析(PCA)对病毒辅助基因数据进行降维处理,提取关键特征。最重要的是,他们采用了提升回归树(BRTs)这一机器学习算法,构建了宿主预测模型和链接预测模型,以此来分析各种因素与正痘病毒宿主之间的关系。
研究结果如下:
  1. 宿主预测模型:基于已知宿主暴露(PCR 检测)或已知易感宿主(病毒分离)数据训练的宿主预测 BRT 模型,具有中等预测准确性。其中,易感宿主模型比宿主暴露模型的整体准确性更高(AUC 分别为 0.88 和 0.86),特异性更高,但敏感性更低。两个模型的预测结果都显示出很强的系统发育信号,并且在预测中发现猫科动物宿主正痘病毒的概率较高,而兔形目和啮齿目动物的概率较低。
  2. 链接预测模型:结合宿主特征和病毒特征训练的链接预测模型,在识别宿主 - 病毒兼容对方面表现更优,准确性、特异性和敏感性都更高。当仅基于宿主特征进行预测时,模型性能会下降。此外,排除与痘苗病毒的宿主关联后,模型的敏感性显著提高,但特异性和整体准确性略有下降。链接预测模型的预测结果同样显示出系统发育信号,与宿主预测模型有相似之处,如都预测猫科动物更易宿主正痘病毒,兔形目和啮齿目动物则相反。
  3. 优化分类:研究人员探索了不同的阈值设定方法来处理数据不平衡问题。结果发现,分类阈值对预测的哺乳动物宿主数量影响很大,尤其是链接预测模型。降低阈值可以提高敏感性,但会增加假阳性率。同时,阈值的选择还会改变预测的哺乳动物宿主的分类组成。
  4. 特征重要性:研究发现,在预测正痘病毒阳性和宿主 - 病毒兼容对方面,一些哺乳动物特征具有重叠性,如宿主属的 PubMed 引用次数(反映采样努力程度)和扩散潜力。在包含病毒和宿主特征的模型中,“岛屿栖息” 和 “扩散” 是两个最重要的宿主特征,且都与宿主正痘病毒的概率呈正相关。在链接预测模型中,病毒特征(由 PCA 得到的主成分表示)对预测宿主 - 病毒兼容性非常重要,其中一些主成分与病毒的宿主相互作用和免疫逃逸功能相关。
  5. 潜在正痘病毒宿主的分布:通过绘制潜在宿主的地理分布图,研究人员发现印度尼西亚、马来西亚、东非南部、西非海岸线、亚马逊盆地和巴西海岸线等地区是正痘病毒宿主的热点区域。这些区域与天花疫苗接种率最低的地区高度重叠,意味着这些地区面临着更高的人畜共患病风险。
    研究结论和讨论部分指出,该研究表明结合病毒基因组特征和宿主生态特征的机器学习模型,比仅基于宿主特征的模型能更准确地预测正痘病毒的宿主。病毒辅助基因数据对预测宿主 - 病毒兼容性至关重要,这为深入了解宿主特异性提供了新的视角。同时,研究还发现预测结果对分类阈值非常敏感,选择合适的阈值对于实际应用至关重要。此外,研究揭示了潜在正痘病毒宿主多样性高的地区与天花疫苗接种率低的地区之间的显著关联,为确定野生动物监测重点区域提供了依据。不过,该研究也存在一些局限性,如采样偏差、数据集不完整和模型可解释性等问题。但总体而言,这项研究为公共卫生监测和防控正痘病毒相关疾病提供了重要的参考,有助于提前预防和应对潜在的疫情风险。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号