
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于深度学习的全景X线片中牙内陷智能检测:YOLOv9模型的突破性应用
【字体: 大 中 小 】 时间:2025年06月06日 来源:BMC Oral Health 2.6
编辑推荐:
本研究针对牙内陷(DI)在全景X线片中诊断困难的问题,采用YOLOv8、YOLOv9和Faster R-CNN三种深度学习模型进行自动检测。结果显示,YOLOv9以94.6%的精确度和93.0%的灵敏度成为最优模型,显著提升DI诊断效率,为临床早期干预提供AI技术支持。
牙内陷(Dens invaginatus, DI)是一种罕见的牙齿发育畸形,其特点是牙釉质向内折叠形成囊袋状结构,常导致牙髓坏死和根尖周病变。由于DI在常规X线片中表现隐蔽且易与正常解剖结构重叠,临床诊断高度依赖放射科医师的经验,漏诊率居高不下。随着人工智能(AI)在医学影像领域的突破,深度学习技术为这一难题提供了新的解决思路。
Necmettin Erbakan大学口腔医学院的研究团队在《BMC Oral Health》发表了一项开创性研究,首次将YOLOv9等目标检测算法应用于DI的全景X线片自动识别。研究团队收集了400例DI患者的全景X线片,通过数据增强技术生成1280张训练图像,并采用YOLOv8、YOLOv9和Faster R-CNN三种模型进行对比测试。结果显示,最新发布的YOLOv9-E模型以94.6%的精确度、93.0%的灵敏度和93.7%的F1值显著优于其他模型,同时保持每图像0.158秒的GPU处理速度。
关键技术方法包括:1)使用LabelImg工具标注1024×512像素的JPG格式图像;2)采用Albumentations库进行垂直翻转、对比度调整等数据增强;3)基于NVIDIA A100和RTX 3060 GPU训练模型;4)以交并比(IoU)≥0.5作为检测阈值;5)开发Flask框架的临床交互界面。
Faster R-CNN
该两阶段检测模型在3000次迭代后达到最佳性能,精确度91.2%,但GPU处理速度(0.1秒/图)明显慢于YOLO系列。其双阶段架构(首先生成区域建议,再进行分类)虽精度较高,但难以满足临床实时需求。
YOLOv8
作为单阶段检测的代表,YOLOv8-Large模型以0.041秒/图的惊人速度完成检测,精确度与Faster R-CNN持平(90.4%)。其优势在于将目标定位与分类合并为单一卷积网络,特别适合处理全景X线片这类高分辨率图像。
YOLOv9
这项研究最引人注目的发现来自YOLOv9-E模型。通过引入可编程梯度信息(PGI)和广义高效层聚合网络(GELAN),该模型在保持实时性能(0.158秒/图)的同时,将DI检测精确度提升至94.6%,灵敏度达93.0%。其创新性的轻量化设计使参数比YOLOv8减少16%,计算量降低27%,却实现1.7%的平均精度(AP)提升。
研究团队还开发了基于Flask的临床交互系统,可同时显示YOLOv8/v9和Faster R-CNN的检测结果对比,辅助医师进行最终诊断。该系统已整合到常规影像工作流中,能自动标记可疑DI区域并生成置信度评分。
这项研究标志着AI在口腔放射学应用的重要进展。YOLOv9展现的优异性能表明,新一代目标检测算法能有效克服传统方法对DI这类细微病变的识别局限。其临床价值体现在三方面:首先,标准化诊断流程可减少不同经验医师间的判断差异;其次,实时处理能力适配门诊高强度工作场景;最重要的是,早期发现DI有助于实施预防性牙髓治疗,避免复杂根管治疗或拔牙。
研究也存在若干局限:仅使用单中心数据可能影响模型泛化性;未纳入根尖片可能遗漏部分根方DI;缺乏不同设备采集图像的稳定性验证。未来研究需扩大样本多样性,并探索三维锥形束CT(CBCT)中的DI检测。尽管如此,这项工作为AI驱动口腔疾病诊断树立了新标杆,其方法论可扩展至其他牙科异常检测领域。
生物通微信公众号
知名企业招聘