MALDI-TOF 质谱联合机器学习算法:精准识别科特迪瓦人血清中恶性疟原虫感染相关蛋白谱

【字体: 时间:2025年04月19日 来源:Malaria Journal 2.4

编辑推荐:

  为解决疟疾诊断方法的局限性问题,研究人员开展了利用基质辅助激光解吸电离飞行时间质谱(MALDI-TOF MS)结合机器学习(ML)算法鉴别恶性疟原虫阳性和阴性血清的研究。结果表明该方法可行,为疟疾诊断提供了新方向。

  疟疾,这个古老而又致命的疾病,长期以来一直威胁着人类的健康。在撒哈拉以南非洲地区,疟疾的肆虐尤为严重,其中恶性疟原虫(Plasmodium falciparum)是最主要的致病寄生虫。目前,疟疾的主要诊断方法包括显微镜检查和快速诊断测试(RDTs),但这些方法存在着诸多局限性。显微镜检查依赖专业人员的操作技能,在非流行地区,相关专业知识正在逐渐流失;RDTs 的灵敏度有限,对于非恶性疟原虫的检测效果不佳。此外,核酸扩增测试(NAATs)虽然准确性较高,但在资源有限的国家,由于缺乏特定的 PCR 试剂盒等原因,也难以广泛应用。因此,开发新的、更有效的疟疾诊断方法迫在眉睫。
来自德国萨尔兰大学医学微生物学和卫生学研究所、科特迪瓦费利克斯?乌弗埃 - 博瓦尼大学等多个机构的研究人员,开展了一项旨在利用基质辅助激光解吸电离飞行时间质谱(MALDI-TOF MS)结合机器学习(ML)算法来识别恶性疟原虫感染的研究。该研究成果发表在《Malaria Journal》上。

研究人员为了实现研究目的,采用了以下几种关键技术方法:首先,采集了科特迪瓦南部五个疟疾流行地区 5 至 58 岁无症状人群的血液样本,从中分离出血清。然后,通过 RDTs 和显微镜检查确定样本的感染状态和寄生虫血症,将样本分为恶性疟原虫阳性和阴性两组。接着,对血清样本进行 MALDI-TOF MS 分析,获取蛋白谱。最后,运用多种 ML 算法对蛋白谱数据进行处理和分析,构建分类模型。

研究结果主要包含以下几个方面:

  1. 疟疾流行情况:共有 486 名参与者,RDT 和显微镜分析显示,恶性疟原虫感染的患病率分别为 69.3% 和 65.6%,大部分阳性样本为恶性疟原虫感染,寄生虫密度在 48 至 34320 p/μL 之间。
  2. 光谱分析和交叉验证性能:MALDI-TOF MS 成功从恶性疟原虫阳性和阴性血清样本中生成了高质量光谱,但两组光谱轮廓相似。使用四种监督式 ML 算法进行十折交叉验证,LightGBM 和随机森林(RF)模型表现较好,全局准确率分别达到 81.3% 和 80.92%,灵敏度分别为 81.68% 和 83.97%。
  3. 基于 ML 模型的独立测试:对 LightGBM 和 RF 这两个最佳模型进行独立测试,使用 57 个血清样本(42 个阳性和 15 个阴性),结果显示 LightGBM 模型的准确率为 85.96%,RF 模型的准确率为 89.47%,进一步验证了模型的有效性。

研究结论和讨论部分指出,MALDI-TOF MS 结合 ML 算法能够区分恶性疟原虫阳性和阴性血清样本,这为疟疾诊断提供了新的思路和方法。然而,该研究也存在一些局限性,例如样本预处理和样本材料类型可能影响疟原虫特异性峰的检测,阴性组未检测其他感染可能影响特异性,样本来源局限、数据集规模有限以及物种多样性不足等。尽管如此,鉴于恶性疟原虫在撒哈拉以南非洲地区的高流行率,基于该数据集开发的 ML 模型仍有助于快速识别大多数疟疾病例。未来,还需要进一步优化该方法,通过使用包含更多物种和地区的数据集训练更强大的模型,结合深度学习和高分辨率蛋白质组学等技术,以提高诊断的准确性、灵敏度和特异性,并实现疟原虫物种的区分和量化。这对于制定精准的公共卫生策略、有效控制疟疾的传播和减轻疾病负担具有重要意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号