突破!深度学习助力 CT 影像精准评估 COVID-19 病情,最高准确率达 96.40%

【字体: 时间:2025年02月23日 来源:Scientific Reports 3.8

编辑推荐:

  为解决 COVID-19 病情评估难题,伊朗拉夫桑詹医科大学研究人员开展用深度学习评估 COVID-19 严重程度的研究。他们利用 CT 影像,得出模型最高准确率 96.40% 的结果。该研究为临床诊断提供新途径,值得一读。

  

新冠疫情下的医学探索:AI 助力 CT 影像评估新冠严重程度


在新冠疫情这场全球大危机中,新冠病毒就像一个狡猾的 “敌人”,即便疫情最严峻的时期已经过去,它仍在一些地方徘徊,给人们的健康带来持续威胁。而且,大部分人对它没有天然的免疫力,它还能快速地在人与人之间传播,这可把大家都 “吓坏” 了。

在疫情防控和治疗过程中,准确检测和评估新冠病情至关重要。目前,逆转录聚合酶链反应(RT-PCR)是新冠的主要筛查手段 ,但它也有不少 “缺点”。虽说它能在 5 - 6 小时内出结果,可整个检测过程耗时较长,还容易出现假阴性的情况。更让人头疼的是,它没办法判断病情的严重程度。这就好比给病人看病,只知道他生病了,却不清楚病得有多严重,该怎么对症下药呢?所以,大家急需一种又快又准的诊断方法,既能及时发现病毒,又能了解病情的轻重,以便进行隔离和治疗。

在这样的背景下,胸部计算机断层扫描(CT)成为了 “救星”。相比 RT-PCR,CT 扫描诊断新冠更快更可靠。它能清楚地看到肺部的各种病变,像磨玻璃样影(GGO)、实变等。医生可以通过这些影像来判断病情,为治疗提供重要依据。但是,CT 影像的判读也有难题。以往,医生主要靠肉眼观察 CT 影像来判断新冠病情的严重程度,这不仅耗费时间,还非常主观。不同的医生看同一张 CT 片,可能会有不同的判断,就像 “一千个人眼中有一千个哈姆雷特” 一样,这可不利于准确诊断病情。

为了解决这些问题,来自伊朗拉夫桑詹医科大学附属阿里?伊本?阿比塔莱布医院的研究人员在《Scientific Reports》期刊上发表了一篇名为 “Development and validation of an automated deep learning framework for grading COVID-19 severity using lung CT images” 的论文。他们通过研究,开发出了一种创新的深度学习系统,能够根据肺部 CT 影像自动评估新冠病情的严重程度,这可给医生们提供了一个 “得力助手”。

研究人员在这项研究中主要运用了以下关键技术方法:首先,在数据预处理阶段,他们采用 Retinex 多尺度变换方法对 CT 扫描进行直方图均衡化,增强图像对比度。同时,还使用了数据增强技术,像随机旋转(±30 度)、水平和垂直翻转、缩放(0.8 - 1.2 倍)以及亮度调整等,让数据更加多样化,提高模型的泛化能力。其次,在特征提取和分类环节,他们借助 Inception - ResNet - v2 架构,将其中的 ResNet 组件设计成扩张结构(dResNet)。这种结构可以更好地从 CT 影像中提取特征,提高对新冠病情严重程度的分类准确性。

下面我们来看看研究结果。

数据集


研究人员收集了 6860 名参与者的数据,其中 2520 人被归类为正常,1188 人无症状。这些数据来自伊朗东南部的阿里?伊本?阿比塔莱布医院,收集时间是 2020 年 4 月到 2021 年 10 月,正好是全球和伊朗新冠疫情的高峰期。CT 扫描使用的是西门子的设备,技术参数都有严格的设定。扫描后的影像由两位经验丰富的胸部放射科医生独立评估,他们的评估误差小于 2%。研究人员根据肺部受累的百分比将影像分为三个等级:小于 20% 受累、20% - 50% 受累、大于 50% 受累,这样可以更清晰地了解病情的严重程度和发展情况。

实验设置


研究人员使用 64 位英特尔操作系统和 NVIDIA GeForce GTX 1650 GPU 进行实验。他们把肺部受累情况分为十个等级,采用 5 折交叉验证技术来验证结果。数据集被分成三个子集,分别用于评估、验证和训练。在训练过程中,Inception - ResNet - V2 架构有很多参数和设置,像批归一化、缩放、激活函数 ReLU 等。他们还对 Inception - dResNet - V2 模型进行了微调,调整了学习率、批量大小等超参数,让模型性能更优。

评估指标


研究人员用了准确率、精确率、灵敏度、F 值和特异性等多个指标来评估模型。通过对比不同结构的模型,他们发现 Inception - dResNet - v2 架构表现出色,在 10 个等级分类任务中,准确率高达 96.41%。10 折交叉验证也表明这个模型可靠准确,虽然数据集中有些类别分类准确率低,但整体来看,该模型在评估新冠病情严重程度方面表现良好。通过 ROC 曲线分析,也能看出该模型在提取病情严重程度信息上很有优势,AUC 值较高,说明模型的性能较好。

在讨论部分,研究人员对多个方面进行了分析。

特征和准确率离散度的影响


研究人员用互信息法选择了高、中、低三个层次的特征,然后把这些特征输入不同结构的模型进行评估。结果发现,随着特征数量减少,其他模型的误差增加,而他们提出的方法由于能在决策过程中产生更丰富的特征,在特征较少的情况下误差也相对较小,展现出了更好的稳定性和鲁棒性。

计算复杂度和收敛性


研究人员对比了多种预训练模型,发现他们提出的方法在使用有限特征的情况下,能达到较高的准确率和计算效率。虽然扩张结构会在一定程度上影响处理时间,但这是在准确率和计算复杂度之间的合理平衡,而且该方法还具有可扩展性。和其他模型相比,Inception - ResNet v2 和 Inception - dResNet v2 架构在特征提取上更先进,能更好地捕捉肺部受累的细节,并且针对十个等级的分类任务进行了优化,对临床决策有很大帮助。此外,该模型在收敛性方面表现良好,能快速准确地找到最优解。

消融研究


研究人员进行了消融研究,单独评估 Inception、ResNet 和 dResNet 架构,发现 dResNet Only 模型表现突出。将不同架构组合后,性能有了显著提升,比如 Inception + dResNet 模型的各项指标都很不错。数据增强和微调也对模型性能有很大的提升作用,最终集成了 Inception + dResNet + 数据增强的方法表现最佳,虽然在内存和推理时间上有一些增加,但性能提升明显,在实际临床应用中很有价值。

比较


和其他研究相比,该研究提出的方法在分类新冠病情严重程度上更准确。一些其他方法的准确率、灵敏度和特异性都不如该研究的模型。不过,该模型也有一些不足,比如灵敏度相对较低,这意味着可能会漏诊一些阳性病例。但总体来说,Inception - dResNet 模型在准确性和特异性方面表现出色,在不同的临床需求下各有优势。

局限性


这项研究也存在一些局限性。一方面,CT 扫描数据不够充足,特征选择过程也没有和其他方法充分结合优化,影响了模型的效果。而且研究使用的 CT 扫描协议只有三种,受特征数量限制,不同阶段的检测率也没有深入考虑。另一方面,数据集存在地域和人口统计学上的限制,只收集了伊朗地区的影像,缺乏种族和地区的多样性,这可能会影响模型的泛化能力。此外,研究没有将手动提取的特征和更合适的特征结合,而且由于成像设备的噪声和缺乏有效去噪方法,数据去噪也是一个难题。不过,基于 Transformer 的方法在解决这些问题上展现出了潜力。

总的来说,这项研究意义重大。它提出的基于 CT 影像分析的十级分类系统,为评估新冠病情严重程度提供了新的思路和方法。通过深度学习框架和扩张结构,模型能有效地从复杂的医学影像中提取特征,在和其他先进模型的对比中,展现出了较高的准确性和可靠性。虽然研究存在一些局限性,但为后续研究指明了方向。未来,研究人员可以利用更多样化的机器学习技术,扩大数据集,进一步优化模型,提高对新冠病情评估的准确性,为抗击新冠疫情提供更有力的支持,帮助医生更好地诊断和治疗患者,守护人们的健康。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号