基于视觉Transformer的全景X线片骨质溶解病变自动检测与分类系统开发及验证研究

【字体: 时间:2025年06月23日 来源:BMC Oral Health 2.6

编辑推荐:

  本研究针对颌骨骨质溶解病变早期诊断难题,开发了基于卷积神经网络(CNN)和视觉Transformer(ViT)的深度学习模型,用于全景X线片(PR)中边界清晰(well-defined)与模糊(ill-defined)病变的自动检测。通过676例PR数据验证,Mask R-CNN结合Swin-Tiny架构表现最优(F1=0.784/0.904),证实ViT组件能显著提升恶性病变识别准确率(AUC达0.971),为临床提供高效辅助诊断工具。

  

颌骨骨质溶解病变是口腔颌面外科常见的病理改变,其特征是骨组织逐渐吸收,在X线片上表现为透射影。这类病变早期往往无症状,但当患者出现疼痛、肿胀或病理性骨折时,疾病可能已进展到晚期。临床上面临两大诊断挑战:一是常规全景X线片(panoramic radiograph, PR)检查中,缺乏经验的医师容易漏诊;二是病变的良恶性鉴别困难——边界清晰的well-defined病变多提示良性囊肿,而边界模糊的ill-defined病变可能预示骨髓炎或恶性肿瘤。现有AI研究多聚焦于CT扫描的全身性骨病变或PR中裁剪后的局部病灶,尚未建立针对完整PR影像的自动化分析系统。

为解决这一临床痛点,来自德国柏林夏里特医院口腔颌面外科与荷兰奈梅亨大学医学中心的研究团队,在《BMC Oral Health》发表了创新性研究成果。该研究首次将视觉Transformer(ViT)架构引入颌骨病变分析领域,开发出能同时检测well-defined与ill-defined病变的AI系统。通过五折交叉验证证实,最优模型对恶性病变的识别准确率(AUC)高达0.971,显著优于传统CNN模型,为临床早期筛查提供了可靠工具。

研究团队采用四大关键技术方法:1)从德国柏林夏里特医院收集676例PR影像(165例well-defined、181例ill-defined、330例对照),由专业医师进行像素级标注;2)对比四种实例分割模型(Mask R-CNN+Swin-Tiny/ResNet-50、Mask DINO、YOLOv5);3)采用COCO数据集预训练与AdamW优化器进行模型微调;4)通过灵敏度、特异性、F1值和AUC等指标系统评估性能,并分析典型误诊案例。

模型架构比较
实验结果显示,包含ViT组件的模型显著优于传统CNN架构。Mask R-CNN+Swin-Tiny在well-defined病变检测中F1值达0.784(AUC=0.881),对ill-defined病变更达到0.904(AUC=0.971)。值得注意的是,ViT模型对恶性病变的特异性高达96.2%,能有效减少假阳性。相比之下,纯CNN架构的YOLOv5表现最弱(F1=0.681),证实ViT在捕捉长程空间依赖关系上的优势。

病变分布特征
数据分析揭示颌骨病变的解剖偏好:well-defined病变好发于上颌骨(占31/165),而ill-defined病变主要累及下颌磨牙区(154/181例涉及下颌体)。这种分布规律为模型训练提供了先验知识,

误诊案例分析
研究深入剖析了模型局限:1)上颌窦区域因解剖复杂导致12.7%假阳性;2)拔牙后骨改建区域易被误判为病变;3)透射伪影干扰小病灶检测(图5)。这些发现为后续模型优化指明了方向,

结论与展望
该研究开创性地将ViT架构应用于PR影像分析,证实其在颌骨恶性病变检测中的卓越性能。临床意义上,这套系统能辅助基层牙医发现易被忽视的早期病变,特别是对ill-defined病变的敏感识别(AUC>0.96)可显著提升恶性肿瘤的检出率。未来需通过多中心数据验证泛化能力,并整合CBCT等三维影像实现多模态诊断。正如作者Niels van Nistelrooij强调:"ViT模型捕捉长程空间模式的能力,使其在复杂解剖背景中识别细微骨改变方面具有天然优势"。这项成果不仅推动了口腔影像AI的发展,更为Transformer在医学图像分析中的应用提供了范式。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号