编辑推荐:
为解决膀胱镜检查中病变检测准确性低的问题,研究人员用 HRNetV2 模型开展研究,结果表明其检测性能良好,有临床应用潜力。
在泌尿系统疾病的诊疗中,膀胱病变的准确检测至关重要,尤其是对于膀胱癌患者的早期诊断和复发监测。然而,目前常用的膀胱镜检查主要依赖传统的白光技术,这种技术存在不少问题。不同经验水平的检查人员对检查结果的主观判断差异较大,即使是同一名检查人员在多次膀胱镜检查时,诊断结果也可能不一致。这就导致了漏诊早期病变、误诊等情况时有发生,严重影响了患者的治疗时机和预后。据相关研究报道,约 10 - 20% 的膀胱癌在膀胱镜检查中会被漏诊 ,传统检测方法的敏感性和特异性波动范围较大,分别为 68 - 100% 和 57 - 97%。尽管蓝光和窄带成像技术在一定程度上提高了膀胱肿瘤的检测率,但肉眼主观识别图像的方式依然无法避免,而且这些技术的操作过程较为复杂,限制了它们的广泛应用。
为了攻克这些难题,中国医学科学院北京协和医院的研究人员 Zixing Ye、Yingjie Li 等人开展了一项关于利用深度学习在膀胱镜检查中实时智能检测膀胱病变的研究。该研究成果发表在《Annals of Surgical Oncology》上。
研究人员主要采用了以下几种关键技术方法:
- 数据收集:从 2022 年 7 月 1 日至 2023 年 7 月 1 日,招募了 94 名在北京协和医院接受膀胱镜检查或经尿道膀胱肿瘤切除术(TURBT)的患者,收集了 102 个白光视频。所有患者均提供了书面知情同意书和完整的基线数据。收集的视频经两位泌尿科医生确认含有膀胱病变后,按 4:1 的比例随机分为训练集和测试集。
- 语义分割方法:采用语义分割方法进行膀胱病变检测,以 HRNetV2 作为编码器,FCN 作为解码器构建 FCN_HRNetV2 分割网络。该网络能够有效提取详细的位置特征,通过反卷积统一不同尺度的特征图分辨率,最后由解码器将特征图恢复到原始图像大小。
- 数据预处理与训练:对原始输入数据进行标准化处理,将其输入网络进行训练。训练过程中使用了多种优化策略,如采用随机梯度下降(SGD)优化器、多项式学习率衰减策略,还运用了图像增强技术,最终经过 80,000 次迭代得到模型。
- 模型评估:使用交并比(IOU)、敏感性、精确性和平均 Dice(mDice)评分等指标对模型的性能进行评估。
下面来看具体的研究结果:
- 整体检测性能:研究人员对 33,657 帧图像进行了手动标注,共标注出 37,947 个目标。神经网络模型在测试集中的诊断敏感性为 91.6%,精确性为 91.3%,mDice 评分为 80.3%。视频增量实验表明,随着数据量的增加,模型性能稳步提升。
- 不同分辨率图像的检测性能:根据病变清晰度和与周围组织的对比度,将测试集中的图像人为分为高分辨率和低分辨率两组。高分辨率组的敏感性和精确性分别为 94.8% 和 94.4%,mDice 评分为 84.7%;低分辨率组的敏感性和精确性分别为 75.6% 和 74.8%,mDice 评分为 56.6%。
- 不同真实目标(GT)面积比例对诊断性能的影响:研究发现,当 GT 面积比例较小时(0 - 0.02),模型性能较差,召回率仅为 0.564;当 GT 面积接近图像一半(0.5 - 0.7)时,模型性能也不理想,但由于该类别目标数量有限,这一结论的可靠性有待进一步验证。
- 影响诊断的因素分析:研究人员还分析了图像质量和潜在的误诊因素。假阳性主要是由于异常的黏膜纹理特征和将小目标误识别为病变;假阴性主要归因于目标特征不典型、目标尺寸较小以及目标离观察点太近。
研究结论和讨论部分指出,HRNetV2 模型在膀胱病变检测中表现出了优异的性能,尤其是在高分辨率图像上,具有较高的敏感性和精确性。这表明该模型在临床实践中提高膀胱病变检测准确性方面具有巨大的潜力。然而,该研究也存在一些局限性,如单中心研究、数据集有限、数据集中各种病理类型分布不均衡等。未来的研究需要进一步优化模型,扩大样本量并进行多中心研究,以提高模型的性能和适用性。
总的来说,这项研究为膀胱病变的检测提供了新的思路和方法,深度学习技术在医学领域的应用前景广阔。HRNetV2 模型有望成为临床医生的得力助手,帮助提高膀胱病变的诊断效率和准确性,为患者的早期治疗和良好预后奠定坚实基础。随着技术的不断发展和完善,相信在未来,深度学习将在医学诊断和治疗中发挥更加重要的作用。