利用定制的卷积神经网络(CNN)在牙科放射图像分析中实现精确的牙齿编号和龋洞检测,这些CNN专门针对牙科应用进行了优化
《PLOS Digital Health》:AI-powered precision in dental radiographic analysis using tailored CNNs for tooth numbering and cavity detection
【字体:
大
中
小
】
时间:2025年11月21日
来源:PLOS Digital Health 7.7
编辑推荐:
牙齿编号与龋齿检测的深度学习系统开发及性能评估,基于全景X光片的FDI系统标注和两种CNN架构对比。摘要:本研究开发了一个模块化深度学习系统,用于数字牙科全景X光片的自动分析,包括32个FDI牙齿编号和龋齿检测。通过935例巴西牙科数据集和3,652例公开数据集的平衡标注,采用Inception-v3和InceptionResNet-v2两种CNN架构,在五折交叉验证下实现编号任务平均F1-score 0.978,检测任务平均F1-score 0.937。实验表明InceptionResNet-v2在多数指标上表现更优,但未达统计学显著性差异。系统通过数据增强(旋转/缩放/亮度调整)和专家多审校标注流程,有效缓解了样本不平衡问题。
在现代医疗体系中,图像数据已经成为临床诊断、治疗方案制定、手术操作以及流行病学研究中不可或缺的组成部分。然而,即便是经验丰富的医疗专业人员,也常常面临着诸如经验不足、误诊风险、主观判断偏差以及由压力和疲劳引起的错误等问题。这些问题可能会严重影响患者病情的评估准确性。特别是在牙科领域,由于牙齿解剖结构的复杂性,对牙科影像的解读更加依赖专家的经验和细致的观察。因此,如何提高牙科影像分析的自动化水平,以减少人为因素对诊断结果的影响,成为了当前研究的重要课题。
近年来,随着人工智能技术的发展,特别是卷积神经网络(CNN)在图像识别任务中的广泛应用,为牙科影像分析提供了新的解决方案。CNN具有强大的特征提取能力,能够从复杂的影像数据中学习到关键信息,从而在牙齿识别和龋齿检测等方面展现出显著优势。在这一背景下,研究人员致力于开发专门用于牙科影像分析的系统,旨在实现牙齿编号和龋齿识别的高精度、高召回率、高准确率、高特异性以及高F1分数,以确保诊断结果的可靠性和一致性。这一研究不仅有助于提高诊断效率,还能在一定程度上减少人为错误,提升医疗服务质量。
在本研究中,我们专注于开发一种专门用于数字牙科放射学的分析系统,该系统特别针对牙齿编号和龋齿识别任务进行了优化。我们采用了两种先进的CNN架构——Inception-v3和InceptionResNet-v2,以评估它们在牙科影像分析中的性能表现。通过使用来自巴西圣保罗大学牙科学院的935张全景牙科X光片(PANs),这些图像由经验丰富的牙医进行标注,我们成功地构建了一个高效的分析框架。在牙齿编号任务中,该系统达到了高达98%的精度、98%的召回率、99.8%的准确率、99.9%的特异性以及98%的F1分数。而在龋齿识别任务中,系统表现同样出色,达到了96%的精度、91%的召回率、94%的准确率、96%的特异性以及94%的F1分数。这些结果表明,该系统能够有效地处理牙科影像数据,为牙医提供可靠的辅助工具。
牙齿编号在牙科诊断和治疗过程中具有重要意义。通过牙齿编号,牙医可以更精确地定位问题牙齿,从而制定个性化的治疗方案。此外,牙齿编号也有助于跟踪口腔健康状况,设计预防措施,并在必要时将患者转介给相关专科医生。同时,牙齿编号对于建立完整的牙科病历和未来的治疗规划也具有不可替代的作用。因此,实现牙齿编号的自动化不仅是提高诊断效率的关键,也为患者提供了更精准的治疗依据。
在本研究中,我们构建了一个多阶段的分析流程,以确保牙齿编号和龋齿识别任务的准确性和可靠性。首先,我们通过专门的模块对口腔区域进行检测,然后对牙齿进行分割,接着为分割后的牙齿分配FDI编号,最后识别牙齿是否存在龋齿。其中,牙齿编号和龋齿识别是本研究的核心任务,而前两个任务则作为基础支持模块,为其提供输入数据。这种模块化的设计不仅提升了系统的灵活性,还使得各个任务可以独立优化,从而提高整体性能。
为了进一步提升模型的泛化能力,我们在训练过程中采用了数据增强技术,包括水平和垂直翻转、旋转、亮度调整以及缩放等。这些增强操作不仅增加了训练数据的多样性,还帮助模型更好地适应不同角度和分辨率的影像数据。同时,我们对数据集进行了平衡处理,确保在训练和测试过程中,各个牙齿类别和龋齿状态都有足够的样本支持。通过这种方式,我们能够在一定程度上缓解数据分布不均带来的问题,并提升模型在不同牙齿类别上的表现。
在牙齿编号任务中,我们发现InceptionResNet-v2相较于Inception-v3在所有关键指标上都表现更优。虽然两种模型在测试中都达到了非常高的准确率,但InceptionResNet-v2的平均精度、召回率和F1分数分别达到了0.979、0.978和0.978,显示出更强的分类能力。此外,InceptionResNet-v2在处理复杂牙齿区域(如后牙)时,表现出更稳定的性能,这可能是由于其残差连接结构能够有效防止过拟合,并加速模型的收敛过程。然而,由于采用的是五折交叉验证,且样本量相对较小,模型之间的性能差异在统计学上并不显著,但这并不影响其在实际应用中的优势。
在龋齿识别任务中,InceptionResNet-v2同样表现出色,其平均精度、召回率和F1分数分别为0.963、0.914和0.937。这些结果表明,该模型在区分“龋齿”和“非龋齿”牙齿方面具有较高的准确性和稳定性。然而,我们也发现,模型在识别龋齿牙齿时仍存在一定的不确定性,尤其是在某些牙齿类别上,其召回率和特异性略低于非龋齿牙齿的识别表现。这提示我们在未来的模型优化中,需要进一步关注龋齿牙齿的识别难点,例如如何提升对早期龋齿的检测能力,以及如何在复杂影像中更准确地定位龋齿区域。
本研究的另一个重要贡献在于其模块化设计和实际应用场景的结合。我们开发了一个基于人工智能的牙科影像分析系统,该系统不仅可以自动完成牙齿编号和龋齿识别任务,还能够为牙医提供一个交互式界面,用于观察和编辑影像分析结果。通过这一系统,牙医可以在详细的影像上进行缩放、叠加等操作,以便更直观地理解分析结果。此外,系统还具备患者记录管理功能,能够将患者的影像数据与历史记录进行对比,帮助牙医监测病情的变化趋势,并做出更加精准的诊断决策。
为了验证模型的性能,我们采用了五折交叉验证方法,并结合Wilcoxon符号秩检验和Benjamini-Hochberg校正技术,以确保结果的统计可靠性。虽然InceptionResNet-v2在多个指标上表现优于Inception-v3,但这些差异并未达到显著水平。这可能与数据集的规模以及五折验证的局限性有关。因此,未来的研究可以考虑扩大数据集规模,并增加交叉验证的折叠数量,以更全面地评估模型的性能。此外,还可以探索更多先进的CNN架构,以进一步提升牙科影像分析的准确性和效率。
除了模型性能的评估,本研究还关注了实际应用中的挑战和未来发展方向。例如,当前的数据集主要来源于巴西的牙科机构,这可能会影响模型的泛化能力。因此,未来的研究可以考虑引入更多样化的数据集,以覆盖不同地区、不同人群和不同影像质量的样本。此外,研究还指出,虽然全景牙科影像在龋齿检测中的空间分辨率不如内窥镜影像,但它具有广泛的覆盖范围和便捷的获取方式,非常适合用于大规模筛查和初步诊断。因此,未来的研究可以探索如何结合不同类型的牙科影像,以提升诊断的全面性和准确性。
本研究的意义不仅在于技术层面的创新,还在于其对实际医疗应用的推动。通过开发一个高效、可靠的牙科影像分析系统,我们为牙医提供了一种全新的辅助工具,使他们能够更快、更准确地完成诊断任务。同时,该系统还可以用于流行病学研究,帮助医疗机构更好地了解口腔疾病的分布情况,并优化资源分配。此外,该系统还可以作为科研资源,为全球范围内的牙科研究人员提供高质量的数据集和分析框架,促进牙科人工智能领域的进一步发展。
综上所述,本研究通过采用先进的CNN架构和模块化设计,构建了一个高效、准确的牙科影像分析系统。该系统在牙齿编号和龋齿识别任务中均表现出优异的性能,为牙科临床诊断提供了有力的支持。尽管当前的研究仍存在一些局限性,如数据集的多样性不足、模型在某些牙齿类别上的识别能力有限等,但这些发现为未来的研究提供了重要的方向。通过不断优化模型性能、扩展数据集范围以及探索更复杂的分析任务,我们可以进一步推动牙科影像分析技术的发展,为全球牙科领域带来更多的创新和突破。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号