综述:CT/CBCT 图像中深度学习牙齿分割的演变:系统综述和荟萃分析

【字体: 时间:2025年05月27日 来源:BMC Oral Health 2.6

编辑推荐:

  本综述聚焦深度学习在 CT/CBCT 牙齿分割的应用,系统梳理算法演变,分类介绍单阶段卷积、U-Net 架构等模型,分析 29 种评估指标,通过荟萃分析得出 DSC 等指标的合并结果,指出现有问题并展望标准化研究方向。

  

研究背景与目的


随着数字 dentistry 的发展,CT 和锥束 CT(CBCT)成为牙科诊断、治疗计划和疗效验证的重要工具。牙齿三维建模在正畸学、修复 dentistry 等领域有广泛应用,而图像分割是三维建模的关键步骤。传统基于阈值的分割方法不适用于牙齿分割,人工分割繁琐耗时,其他传统算法也存在参数需手动调整、鲁棒性差等问题。深度学习作为人工智能的一部分,在医学图像自动分割中展现出潜力,已被用于牙齿自动标注和分割。然而,以往文献缺乏对深度学习算法的关注,且由于模型多样、评估指标不同,深度学习在牙齿分割中的性能定量分析尚不明确。本系统综述和荟萃分析旨在评估深度学习算法在牙齿分割中的演变和性能,为潜在临床应用提供最新见解。

材料与方法


本研究遵循 PRISMA-P 指南,在 PubMed、Web of Science 等多个数据库进行文献检索,检索词包括 “tooth”“segmentation”“CT”“CBCT” 等。纳入标准为:研究类型为回顾性、前瞻性或横断面研究;深度学习算法应用于 CT/CBCT 图像的人类牙齿分割,使用公共或私有数据集;报告分割准确性评估指标。排除标准包括非英文研究、未应用深度学习的人工或半自动分割研究、非 CT/CBCT 图像模态研究等。

研究选择分两阶段进行,由三位作者独立审查标题、摘要和全文,分歧通过共识解决。从纳入研究中提取年份、研究类型、深度学习算法结构和特征、样本特征、评估指标特征等数据。使用 QUADAS-2 工具评估纳入研究的偏倚风险,评估领域包括患者选择、指标测试、参考标准、患者流程和时间等。

荟萃分析的主要结果为深度学习算法的牙齿分割准确性,以牙齿数量为样本量,若未报告牙齿数量,则假设每个个体有 28 颗牙齿进行估计。提取纳入研究的均值和标准差,未报告标准差的研究使用其余研究的合并标准差作为估计。进行 Z 检验比较包含和不包含估计标准差的合成结果,比较单根牙和多根牙的分割准确性,使用随机效应模型计算评估指标的合并均值,Cochran Q 检验的 I2 值评估统计异质性。

结果


研究选择


共从数据库中检索到 3361 项研究,去除重复后剩余 2607 篇进行标题和摘要筛选,181 篇进入全文评估,最终 30 项研究纳入系统综述,28 项因数据不足排除 2 项后纳入荟萃分析。

纳入研究特征


纳入研究几乎均为横断面研究(96.7%),最早发表于 2019 年。最常用的成像方式是 CBCT(93.3%),其次是 CT(6.7%)。40% 的研究使用手动分割作为参考标准,16.7% 使用半自动分割,43.3% 未提及标准。70% 的研究使用内部验证评估训练性能,6.67% 使用外部验证,3.33% 结合内外验证,20% 未提及评估方法。86.7% 的研究未指定分割牙齿类型或包含所有类型,13.3% 按牙齿类型或单根、多根分类。

深度学习算法演变


深度学习算法分为单阶段卷积模型、U-Net 架构卷积模型、Transformer 模型、带注意力机制的卷积模型和多模型组合。单阶段卷积模型以 FCN 为代表,经改进出现 VoxResNet、DenseVoxelNet 等。U-Net 及其变体如 UDS-Net、Dense U-Net 是最常用算法。Transformer 模型基于多头注意力机制,Swin-Transformer 等已应用于牙齿分割。注意力机制与 U-Net 结合形成 AttU-Net 等模型。多模型组合旨在提高鲁棒性,如 Tooth-Net、DHU-Net 等。

分割准确性评估指标


共识别出 29 种评估指标,分为基于重叠(如 DSC、IoU)、距离(如 ASSD、95HD)和体积(如 RVD、VD)的指标。DSC 是最常用指标,其次是 IoU、ASSD、敏感性、95HD 和精度。

偏倚风险和适用性担忧


患者选择领域仅 9.1% 研究偏倚风险低,90.1% 风险不明确,但均适用性担忧低。指标测试领域所有研究偏倚风险和适用性担忧均低。参考标准领域 51.5% 研究偏倚风险高,30.3% 低,18.2% 不明确,适用性担忧均低。流程和时间领域所有研究偏倚风险低。

牙齿分割合并准确性


DSC 合并结果为 0.93 [0.93,0.93],IoU 为 0.86 [0.85,0.87],ASSD 为 0.22 [0.19,0.24],敏感性为 0.92 [0.90,0.94],95% Hausdorff 距离为 0.71 [0.26,1.17],精度为 0.96 [0.93,0.98]。所有森林图 I2 值均 > 90%,显示高异质性。单根牙和多根牙的合并结果无显著差异,样本量与分割性能无明显相关性。

讨论


本研究首次全面分析深度学习算法在牙齿分割中的演变并提供性能最新见解。U-Net 架构是牙齿分割的主流结构,注意力机制的整合成为新研究方向,深度学习算法可实现高达 0.93 的 DSC 准确性。

U-Net 通过跳接连接结合不同层次抽象信息,有利于牙齿分割,3D U-Net 架构如 VoxResNet、DenseVoxelNet 利用 3D 卷积捕捉空间关系,提升性能。多尺度信息捕捉和数据增强技术也有助于提高分割准确性。

Transformer 模型擅长捕捉全局依赖,学习高效特征表示,但需大样本预训练,限制实际应用。未来可能继续整合卷积模型与 Transformer 注意力机制,提高准确性同时减少计算时间。

研究间样本量差异大,且样本量与分割准确性无明确关系,可能因 AI 模型性能随样本量增加趋于稳定,过度样本量未必提升性能。

评估指标多样,DSC 最常用,但缺乏临床相关指标。临床场景中,如正畸治疗中金属伪影、牙种植中根尖分割准确性等,现有指标可能无法全面评估性能,需结合牙齿类型、邻近结构等开发临床适用指标。

纳入研究存在显著异质性和高偏倚风险,源于数据集、模型、设计差异及参考标准交叉验证不足等。未来需标准化协议、开放标注数据集,明确采样方法、交叉验证参考标准和报告牙齿数量,以提高研究可比性。

本研究是首项全面调查深度学习在牙齿分割应用的系统综述和荟萃分析,DSC 值 0.93 为未来研究提供基准。但需注意研究异质性和偏倚风险,进一步临床研究需确认深度学习在 CT/CBCT 牙齿分割的临床适用性,未来可探索多生牙识别、根尖周病变自动检测等高级应用。

结论


深度学习算法在牙齿分割中的应用显著推进了分割进程,U-Net 及基于 U-Net 的算法流行,Transformer 模型和多模型组合的出现是未来发展趋势。本研究提供 0.93 的 DSC 参考值,但需开展标准化协议、评估指标和开放标注数据集的研究,以更好比较不同算法,同时需开发临床适用的评估指标。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号