编辑推荐:
为解决传统病毒 CPE 检测难题,安卡拉大学兽医学院的研究人员开展 AIRVIC 系统研究。结果显示该系统能高效检测和分类病毒 CPE。此研究成果为病毒研究提供新工具,强烈推荐科研读者一读,助您了解前沿进展。
在病毒研究的领域中,细胞培养是探索病毒奥秘的重要 “阵地”。病毒作为一种特殊的生物,是细胞内的 “寄生客”,在细胞培养过程中,它们有的会引发细胞病变效应(Cytopathic Effects,CPE),有的则 “悄无声息”。这些 CPE 就像是细胞在病毒 “入侵” 后的 “求救信号”,细胞会出现形态上的变化,比如像气球一样膨胀变大、逐渐变圆,甚至出现颗粒化、融合成多核巨细胞(syncytia formation)、裂解破碎以及从培养瓶壁上脱落等情况。通过观察这些变化,科研人员能追踪病毒感染的进程,了解病毒的 “作案手法”、疾病的发展规律,还能评估抗病毒治疗的效果。
然而,传统的细胞培养观察 CPE 的方法存在不少问题。一些病毒引发的 CPE 非常微妙,就像隐藏在黑暗中的 “小偷”,很难被发现;还有些病毒的 CPE 出现得很晚,这给科研人员的判断增加了难度。而且,CPE 的识别和解读主观性很强,就像不同人对同一幅画有不同的理解一样,需要专业的训练才能准确判断。更麻烦的是,细胞受到的其他压力或者一些外界因素,也可能让细胞出现类似 CPE 的变化,这就像 “假冒伪劣” 产品,迷惑了科研人员的眼睛,导致需要更多的测试来确认。不仅如此,细胞培养过程繁琐,耗费大量的人力、物力和时间,成本很高。要是再遇上病毒的遗传多样性和混合感染的情况,那简直就是 “雪上加霜”,让病毒检测变得更加复杂。
为了攻克这些难题,来自安卡拉大学兽医学院病毒学系的研究人员在《Scientific Reports》期刊上发表了一篇名为 “AI Recognition of Viral CPE (AIRVIC): An Automated System for Label-Free Detection and Classification of Cytopathic Effects Induced by SARS-CoV-2 and Bovine Viruses” 的论文。他们开发了一个神奇的 AI 自动化系统 ——AIRVIC,这个系统就像一个火眼金睛的 “病毒侦探”,能够准确地检测和分类由 SARS-CoV-2、BAdV-1、BPIV3、BoAHV-1 以及两种 BoGHV-4 毒株在 Vero 和 MDBK 细胞系中引发的无标记细胞病变效应。
研究人员在研究过程中,运用了多种关键技术方法。他们首先构建了病毒诱导的数据集,收集了大量不同病毒在不同细胞系、不同感染复数(Multiplicity of Infection,MOI)和不同感染时间点下的显微镜图像。然后,他们利用卷积神经网络(Convolutional Neural Networks,CNN),选取了 ResNet50、ResNet18、MobileNetV2 和 YGNet 等架构进行模型开发。为了解决数据集不平衡的问题,他们还采用了数据增强技术,让模型能更公平地学习。最后,通过划分训练集、验证集和测试集,对模型进行训练、验证和评估,不断优化模型性能。
下面来看看研究的具体结果。
- 深度学习模型准确高效检测病毒 CPE:研究人员收集了 40369 张图像,涵盖多种病毒、细胞系、MOI 和感染时间点。在选择模型架构时,对比了 ResNet18、ResNet50、MobileNetV2 和 YGNet 等。最初使用 ResNet50 在 BoAHV-1/MDBK 数据集上训练,因数据集不平衡,F1 分数较低。经过数据增强后,F1 分数和准确率显著提升。后来加入不同放大倍数的图像,发现 10X - 20X 和 40X 放大倍数的图像能提高模型检测能力,最终选定 ResNet50 作为后续研究的基线模型。这表明深度学习模型在检测病毒 CPE 方面表现出色,但需要大量多样的数据集支持 。
- AIRVIC 的病毒分类结构化方法:AIRVIC 采用了一种分层系统来优化病毒检测和分类。这个系统由三个深度学习模型组成,就像三个不同职能的 “小侦探”。“广谱 CPE 检测模型” 是 “先锋侦探”,它能快速识别出是否存在 CPE 以及可能的病毒活动;如果发现了 CPE,就轮到 “病毒特异性 CPE 检测模型” 上场,它会像个 “分析专家”,给出引发 CPE 的可能病毒;最后,“靶向 CPE 检测模型” 像个 “精准狙击手”,进一步确认结果。在对不同病毒 - 细胞系组合的靶向 CPE 检测中,很多模型都表现出色。比如 BoGHV-4 (DN-599)/MDBK 模型的准确率达到了 100%,BPIV3/Vero 模型的准确率也有 98.74% 。
- 广谱 CPE 检测模型的优势:“广谱 CPE 检测模型” 使用整个数据集进行训练,能检测多种病毒和细胞系中的 CPE。经过 100 个训练周期后,它的 F1 分数达到 0.9495,准确率为 0.9528。虽然它的性能指标比一些靶向模型略低,但它可以覆盖所有场景,在识别野外样本中的病毒诱导 CPE 时,具有计算效率优势,还有潜力检测新病毒引发的 CPE 。
- AIRVIC 在病毒鉴定方面的成果:“病毒特异性 CPE 检测模型” 不仅要识别 CPE,还要确定是哪种病毒和细胞系组合导致的。不同配置的模型表现有所不同。在 11 类混合细胞系模型中,F1 分数为 0.7032,准确率为 0.6960;MDBK 细胞的 5 类模型准确率达到 0.8761。而且,AIRVIC 还能区分两种病毒毒株,成功率为 81.29%,这是很多传统 PCR 反应做不到的 。
从研究结论和讨论部分可以看出,AIRVIC 系统的出现意义重大。在之前的研究中,利用深度学习检测病毒诱导的形态缺陷主要集中在人类病毒,针对动物病毒的研究非常少。而 AIRVIC 的出现填补了这一空白,它在检测动物病毒感染方面表现出色。在检测病毒 CPE 时,它的单任务模型平均准确率达到 95.31%,多任务模型在区分 MDBK 细胞中产生的四种不同病毒时,准确率为 87.29%,还能以 84.89% 的准确率分类 BoGHV-4 的两种毒株。
不过,AIRVIC 也有一些局限性。它目前主要用于检测、诊断和分类,还不能计算病毒滴度。而且,它的模型是基于 ZEISS Axio Observer 5 显微镜获取的图像开发的,在其他显微镜上的效果还不确定。但 AIRVIC 已经作为一个基于网络的平台向全球研究人员开放,就像一把万能钥匙,为病毒诊断和研究提供了强大的支持。随着研究的不断深入,它的病毒数据库会不断扩大,功能也会越来越强大。
这项研究充分展示了 AI 在病毒研究领域的巨大潜力,它能简化实验室工作流程,快速检测病毒和区分病毒毒株,对改善人类和动物健康有着重要意义,为全球健康威胁的应对提供了更快速、有效的手段。就像为病毒研究打开了一扇新的大门,让科研人员能更深入地探索病毒的世界,守护人类和动物的健康。