利用IR Biotyper(傅里叶变换红外光谱)快速分型肺炎克雷伯菌:基于荚膜基因型(KL)的机器学习分类器开发与验证

【字体: 时间:2025年10月07日 来源:Microbiology Spectrum 3.8

编辑推荐:

  本研究评估了IR Biotyper(傅里叶变换红外光谱技术)对肺炎克雷伯菌(K. pneumoniae)进行序列分型(ST)和荚膜分型(KL)的能力。结果表明,该技术对KL分型的准确率达100%,且开发的机器学习分类器具有高度一致性,为医院感染暴发的快速监测提供了低成本、高通量的解决方案。

  
ABSTRACT
肺炎克雷伯菌(Klebsiella pneumoniae)是医疗相关感染中最常见的病原体之一。目前进行这些细菌流行病学分型的金标准方法是全基因组测序(WGS),但该过程昂贵且技术难度大。IR Biotyper(布鲁克·道尔顿公司)是一种基于傅里叶变换红外光谱(FTIR)的新设备,可提供快速、低成本且用户友好的细菌分离株分型方法。然而,仍需进一步研究评估IR Biotyper的实际效能。本研究旨在评估IR Biotyper根据序列类型(ST)和荚膜类型——使用K基因座(KL)——对肺炎克雷伯菌进行分型的能力,并利用机器学习开发分类器。研究选取了73株经WGS预先表征的肺炎克雷伯菌分离株,通过IR Biotyper进行分析,采用主成分分析(PCA)进行降维,欧几里得距离和非加权配对算术平均法(UPGMA)进行聚类,光谱分析在1300–800 cm-1波数范围内进行。其中54株用于创建分类器,19株用于验证分类器。当考虑ST时,ST307与ST11被分在同一簇中。而以KL进行分析时,所有簇均按其KL类型被100%正确分组。此外,所开发的分类器能够高度一致地按KL对分离株进行分类。本研究表明,使用IR Biotyper对肺炎克雷伯菌分离株进行分型时,KL与KL之间具有良好相关性。此外,IR Biotyper被证明是一种经济高效的方法,并且是在几分钟内对分离株进行分类的有前景的工具。
IMPORTANCE
肺炎克雷伯菌是严重医院感染的主要原因,控制其传播需要快速识别和比较细菌菌株。全基因组测序(WGS)准确但昂贵、耗时且技术要求高。在本研究中,我们评估了IR Biotyper,该设备利用红外光分析细菌并按荚膜类型(与其传播相关的关键特征)对其进行分组。IR Biotyper以高精度匹配WGS结果,在几分钟而非数天内提供结果。这种快速、经济的方法可以帮助医院更早地检测疫情并更有效地做出反应。我们的研究结果表明,IR Biotyper是微生物学实验室常规使用的宝贵工具,可支持流行病学监测和疫情控制。
INTRODUCTION
耐碳青霉烯类肺炎克雷伯菌(CRKP)是公共卫生中最受关注的优先病原体之一。因此,开发能够实时追踪CRKP菌株在医疗环境中传播的方法至关重要,这些菌株由于增加的抗生素耐药性和/或毒力因子而具有引起感染暴发的高潜力。细菌分型通常通过遗传方法进行监测和表征,这些方法可以根据K基因座(KL)确定荚膜类型、菌株类型(ST)、核心基因组多位点序列分型等特征。这些方法需要对某些基因或全基因组进行测序,昂贵、费力且耗时。作为替代方案,傅里叶变换红外(FTIR)光谱已成为一种分型工具。FTIR光谱是一种表型方法,基于细菌细胞中存在的分子中不同化学键通过暴露于红外光束而产生的差异振动。由于不同的官能化学基团在不同波长吸收红外辐射,产生特定的光谱峰,这些峰与波数的吸光度相关。该方法已应用于评估暴发中分离株之间的关系,并根据特定特征(如KL类型)对细菌进行分类,可用于细菌表征和监测。KL是一个染色体区域,编码大约10–30个负责荚膜生物合成途径的基因。迄今为止,已定义了总共147个基因座,并且发现KL类型与血清学定义的K类型(荚膜抗原)非常相关。尽管评估通过FTIR进行KL分型的研究采用了衰减全反射(ATR)模式并呈现出有希望的结果,但评估透射模式的研究仍然缺乏。IR Biotyper是布鲁克(Daltonik, GmbH)开发的一个平台,它使用透射模式的FTIR并提供了非常用户友好的软件。它允许用户在几分钟内评估细菌分离株的相关性,并通过应用人工智能开发分类器将其按某些特征进行分类。因此,本研究的目的是开发一个分类器,并评估IR Biotyper根据KL类型对细菌分离株进行分类的能力。该研究还评估了IR Biotyper根据ST对肺炎克雷伯菌进行分型的性能。
MATERIALS AND METHODS
Selection of isolates
总共选择了73株先前通过全基因组测序(WGS)(Illumina miSeq)表征的肺炎克雷伯菌分离株进行IR Biotyper分析,这些菌株作为我们实验室常规流行病学监测的一部分。菌株收集于2019年至2023年之间,代表了与医疗相关感染经常相关的各种临床相关ST和KL。选择旨在包括遗传多样性(六个ST和七个KL),以构建和验证稳健的FT-IR分类器。分离株被随机分为训练集(n = 54)和验证集(n = 19),包含我国最流行的ST,同时在两个集合中保持不同ST和KL类型的比例代表性。训练集用于使用IR Biotyper软件构建基于KL的分类器。验证集由未包含在分类器训练中的分离株组成,用于独立评估分类器的性能。这种方法用于避免偏差并确保验证集真正测试分类器的不同分离株。表型上在穆勒-辛顿琼脂上呈半透明的分离株被排除,因为先前的测试表明菌落颜色可能影响IR Biotyper的解释。
Whole genome sequencing
分离株通过Illumina MiSeq(2 × 250 bp;平均测序深度~100×)进行测序,使用Maxwell RSC培养细胞DNA试剂盒(Promega)提取基因组DNA。浓度通过Qubit dsDNA HS检测试剂盒与Qubit four荧光计(Thermo Fisher Scientific)测定,并使用TapeStation 2200(Agilent, UK)评估片段长度。DNA质量通过NanoDrop测定,并考虑了260/280比率。使用Illumina DNA prep(Illumina)根据制造商的协议构建配对末端文库。原始短读段进行质量修剪(Q > 30)并使用CLC Genomics Workbench 23进行组装。序列类型和KLocus从PathogenWatch获得,这是一个用于基于WGS的分型的生物信息学工具。
IR Biotyper
选定的分离株通过FTIR光谱方法使用IR Biotyper(Bruker Daltonics)设备进行表型表征。细菌分离株在麦康凯琼脂上继代培养,生长后,在穆勒-辛顿琼脂平板上继代培养。通过将1 μL接种环的细菌菌落重悬于含有无菌金属棒的IR Biotyper悬浮瓶中的50 μL 70%乙醇溶液中来制备每种分离株的细菌悬浮液。悬浮液剧烈涡旋,加入50 μL去离子水并再次涡旋。将15 μL细菌悬浮液点样五次技术重复于IR Biotyper靶板上,并在环境空气中干燥。使用OPUS 7.5软件(Bruker Daltonics GmbH & Co. KG, Bremen, Germany)获取光谱。1300–800 cm的光谱范围由IR Biotyper软件自动处理并归一化,并应用二阶导数。数据还通过IR Biotyper软件进行分析,首先通过主成分分析(PCA)进行降维到2D图形验证分离株的分布,并使用欧几里得距离和非加权配对算术平均法(UPGMA)(软件使用的统计方法,用于计算成对光谱距离并生成层次聚类)进行聚类方法。然后开发了一个分类器(IR Biotyper软件中包含的机器学习模型),以便根据KL类型对分离株进行分类,遵循制造商的说明。应用默认的拼接方法和先前PCA的人工神经网络,参数如下:应用0.95的截断值来定义分离株之间的光谱相似性,并且前20个主成分(PCs)包含在模型中。相似性矩阵是根据光谱之间PCA得分的相关性计算的,按照制造商的标准算法。聚类使用IR Biotyper软件提供的内置层次聚类算法执行,不需要额外的训练周期,因为分类是无监督且数据驱动的。结果可靠性的异常值和内围值阈值分别设置为4.99和4.98。用于训练集的分离株列在表S1中。用于验证集的其余分离株列在表S2中。
RESULTS
在用于创建分类器的54株肺炎克雷伯菌分离株中,有六种不同的ST(ST11、ST15、ST16、ST258、ST307和ST340)和七种不同的KL(KL102、KL105、KL107、KL151、KL24、KL51和KL64)。在ST11分离株中,有10株KL64和8株KL105。所有ST15均为KL24(n = 6),ST16均为KL51(n = 18),ST258均为KL107(n = 5),ST307均为KL102(n = 3),ST340均为KL151(n = 4)。考虑到按KL分析,训练集中的所有分离株都根据其KL类型进行分组。当考虑按ST分析时,不同的KL被分在同一簇中,并且ST307被绘制到ST11中。其余分离株(验证集)使用开发的分类器按KL进行分类。用于验证分类器的分离株也被绘制到2D图形中,这样可以观察根据WGS确定的KL类型的分离株分布。
DISCUSSION
FTIR是一种传统上用于化学的表型方法,以快速、非破坏性、简单、廉价和高通量的方式确定各种结构的分子组成。FTIR也已发展用于细菌鉴定。IR Biotyper设备(Bruker Daltonik, GmbH)自2018年起可用,是一个基于FTIR技术的系统,允许快速的细菌分子分型。直到最近,只有少数研究评估了IR Biotyper与WGS相比表征分离株的能力。考虑到肺炎克雷伯菌分离株,最近的研究表明,IR Biotyper在将分离株分类到同一ST簇方面没有提供可靠的结果。事实上,结果表明IR Biotyper将不同ST的分离株分组到同一簇中,或者并未将所有相同ST的分离株分组到同一簇中。我们在将IR Biotyper的结果与WGS建立的ST进行比较时也发现了类似的结果。已知肺炎克雷伯菌在培养基中由于发育良好的荚膜而呈粘液状外观,这些荚膜分为77种类型。此外,荚膜分型已被证明是血清分型的良好标志物,具有良好的重现性和区分临床分离株的能力。此外,大约所有荚膜血清型都与KL相关。因此,我们尝试评估IR Biotyper根据ST以及KL对肺炎克雷伯菌进行分型的能力。如前所述,仅考虑ST时,IR Biotyper与WGS的相关性较低,因为属于相同ST的分离株分布在不同簇中,而不同ST的分离株被分组到同一簇中。当我们使用KL评估肺炎克雷伯菌时,所有73株分离株都根据其KL类型进行分组,表明使用IR Biotyper对肺炎克雷伯菌分离株进行分型时,FT-IR与KL具有良好相关性。然而,需要注意的是,本研究未包括共享相同KL的多个ST,这无法允许直接比较不同遗传背景下的KL聚类。因此,FT-IR按KL分型是否总能区分具有相同KL的不相关ST仍未得到证实,需要未来的研究来解决这些互补的基因组方法。此外,我们使用54株按KL正确分离的分离株创建了一个分类器,以便对其余分离株进行分类。进行分类时,15株分离株根据其KL被正确分类,而只有具有KL15、KL10和KL46(未包含在分类器训练集中)的分离株被错误分类为KL102。然而,该分类的得分——分类器在指定KL类型时生成的置信值(0–100%)——为0%,这表明该分类不可靠,正如预期的那样。有趣的是,一株被正确分类到其KL的分离株(GKPN 0375)显示出0%的得分,表明分类器可能可以改进,可能考虑不同的截断值或不同的参数来接受分类器的结果。因此,在考虑将分类器用于实验室常规之前,还需要更多的研究。据我们所知,这是第一项使用KL通过IR Biotyper技术对不同肺炎克雷伯菌菌株进行分型的研究。使用考虑KL和ST的分类器在IR Biotyper中被证明是一种有前景的工具,与WGS相比,可以更快、更经济地对肺炎克雷伯菌进行分型。
ACKNOWLEDGMENTS
本研究得到了国家科学技术发展委员会(CNPq 407953/2022-1)和国家抗菌药物耐药性研究所(INPRA)(INCT CNPq 465718/2014-0)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号