
-
生物通官微
陪你抓住生命科技
跳动的脉搏
首个公开标注的口腔内图像数据集推动AI驱动的龋齿检测研究
【字体: 大 中 小 】 时间:2025年07月26日 来源:Scientific Data 5.8
编辑推荐:
本研究针对全球35亿人受龋齿困扰而临床诊断存在主观性的问题,首次公开了包含6,313张标注口腔内图像的AI驱动龋齿检测数据集,采用LabelMe标注并经牙医验证,支持YOLO/PASCAL VOC/COCO多格式。通过训练YOLOv8s等5种模型(最高mAP@0.5IoU达0.841),为AI牙科诊断设立新基准。
龋齿是全球最普遍的口腔疾病,世界卫生组织(WHO)数据显示其影响超过35亿人,尤其在低收入和中等收入国家(LMICs)的青少年中发病率持续攀升。传统诊断依赖牙医经验性判断,存在视觉检查可重复性差、X射线辐射暴露等问题。尽管研究表明专业牙医能达到良好的检查者间一致性,但临床实践中仍常见诊断分歧,这主要源于光线条件、视野限制等客观因素。人工智能(AI)技术的引入为解决这一难题提供了新思路,但现有研究面临关键瓶颈——缺乏高质量标注的临床图像数据集。此前Yoon等学者虽构建了24,000张图像数据集却未公开,而另一公开数据集仅含718张图像,难以满足深度学习(DL)模型对大数据量的需求。
为填补这一空白,巴基斯坦卡拉奇阿迦汗大学(The Aga Khan University)的研究团队在《Scientific Data》发表了首个公开标注的口腔内图像数据集。该研究在10-24岁青少年中采集6,313张图像,通过定制移动应用标准化拍摄流程,采用LabelMe软件标注并经专业牙医校准,最终转换为YOLO、PASCAL VOC和COCO等多格式兼容数据集。团队特别设计了包含颊侧牵开器使用与否的双重拍摄方案,涵盖颌面、左右侧等5种视角,完整呈现混合牙列与恒牙列特征。
关键技术包括:1)基于三星Galaxy A23移动设备开发标准化采集流程;2)使用LabelMe V5.4.1进行边界框标注,标注者间一致性Kappa值达0.89;3)采用Python实现数据匿名化及格式转换;4)训练YOLOv5s/YOLOv8s等5种模型时默认使用数据增强技术。
数据记录
数据集包含按视角分类的JPG图像及多格式标注文件,其中JSON文件详细记录牙齿空间坐标,用"d/D"区分乳恒牙龋坏。技术验证显示,内置网格系统保障了图像比例一致性,牙科椅灯光标准化消除了照明偏差。
数据描述
Zenodo仓库中数据集按"图像/标注/基准测试"三级架构组织,包含试点活动、使用牵开器(W/R)和无牵开器(W/O-R)三类子集。图2展示的目录结构中,标注文件细分LabelMe/YOLO等格式,基准测试集则按训练/验证/测试划分。图4直观呈现了5种标准化拍摄视角,包括上颌occlusal观和双侧颊侧观。
数据结果
在6,313张图像(5,050训练/631验证/631测试)上,YOLOv8s以mAP@0.5IoU=0.841的优异表现超越其他模型(表1)。YOLOv5s虽训练效率更高,但精度(0.768)显著低于YOLOv8s(0.828)。值得注意的是,SSD-MobileNet-v2和Faster R-CNN分别仅获0.68和0.306的mAP,凸显YOLO系列在牙科图像检测中的优势。
该研究开创性地解决了AI牙科诊断的数据可获得性问题,其严格标注流程和多元兼容格式为后续研究设立新标准。局限性包括:1)未涵盖氟牙症标注;2)仅使用单一手机型号拍摄;3)未包含10岁以下乳牙列数据。未来研究应扩展设备多样性并纳入乳牙龋检测,这将进一步推动AI在口腔健康领域的转化应用。
生物通微信公众号
知名企业招聘