编辑推荐:
为解决结直肠癌诊断中息肉分类不准确的问题,研究人员开展基于 NICE 分类的息肉特征分类研究。开发并训练多类分类器,在内部数据集上分类准确率超 92%,公共数据集超 88%,有助于提升临床决策准确性。
在全球范围内,结直肠癌是严重威胁人类健康的常见癌症,如同隐匿在肠道中的 “定时炸弹”。据世界癌症研究基金会国际数据,其每年新增近两百万病例。结肠镜检查作为诊断结直肠癌的金标准,主要通过发现息肉(一种肠道内的异常生长组织)来预防癌症发生。息肉分为癌性(腺瘤)和非癌性(增生性),准确识别息肉类型对临床决策至关重要,因为漏诊腺瘤会增加癌症风险,而错误切除非癌性息肉则会给患者带来不必要的负担。
目前,虽然有多种息肉分类系统,但传统方法依赖手工特征,模型可解释性差;深度学习方法虽有进展,但多基于私人数据集,分类类别有限,临床可解释性不足。在此背景下,来自伦敦奥丁视觉(Odin Vision)、伦敦大学学院(University College London)等机构的研究人员开展了一项旨在提高息肉分类准确性的研究,相关成果发表于《International Journal of Computer Assisted Radiology and Surgery》。
研究人员为实现根据 NICE 分类对息肉的纹理、颜色和血管特征进行分类的目标,采用了基于 ResNet 的深度神经网络。考虑到 NICE 分类中第三类(深层黏膜下浸润癌)数据有限且医生较易分类,本研究聚焦于前两类(腺瘤和增生性息肉) ,将其构建为多类问题,每个特征类别有两个标签。模型选用在 ImageNet 上预训练的 ResNet-101,共分为四个类别进行分类,包括颜色、表面模式、血管和诊断。训练过程中引入 “无法区分” 标签处理低质量图像,损失函数采用标准交叉熵损失,激活函数为 softmax 。数据集按 60% 训练、10% 验证、30% 测试的比例划分,训练时对数据进行增强处理,最后通过阈值处理筛选预测结果。
研究结果主要分为以下几方面:
- 数据集:由于缺乏公开的 NICE 特征注释数据集,研究人员使用了三个数据集,其中两个为私人数据集,一个为公共 PICCOLO 数据集。私人数据集用于训练,PICCOLO 数据集用于测试。数据集中的图像均为高质量窄带成像(NBI)帧,并标注了四个独立标签。
- 难以区分标签的处理:研究对比了包含和不包含 “无法区分” 标签训练的模型,结果显示两者差异不显著。因此,最终模型训练时未使用该标签,但保留其用于过滤低质量数据。
- 定性结果:部分图像因光线反射等问题给特征分类带来挑战,且区分 1 型和 2 型特征有时较困难。不过,多数数据分类效果较好。
- 定量结果:阈值处理前,各特征在不同数据集上的准确率和 AUC 值相似,均达到至少 80%,颜色特征表现相对突出。阈值处理后,所有指标均有提升,在不同数据集上,各特征的准确率提高了 4 - 5%,AUC 值提高了 1 - 2%。
研究结论表明,该模型能够以较高准确率对 NICE 分类中的息肉特征进行分类,在内部数据集上准确率超 92%,在 PICCOLO 数据集上超 88%。这一分类方法为临床医生提供了医学上可解释的诊断依据,有助于提高诊断准确性,进而改善患者预后,优化临床工作流程。但研究也存在局限性,如数据量有限、注释主观以及 NICE 分类系统本身存在缺陷等。未来研究计划扩展模型,纳入锯齿状息肉和息肉病工作组(WASP)分类,以进一步提升诊断能力。总体而言,该研究为结直肠癌筛查的计算机辅助诊断奠定了坚实基础,推动了该领域的发展。