基于蒙特卡洛方法的不确定性估计在端到端深度学习模型中的应用——用于儿童和青少年牙齿年龄的评估
《Engineering Applications of Artificial Intelligence》:Monte Carlo-based uncertainty estimation in end-to-end deep learning model for children and adolescents' dental age assessment
【字体:
大
中
小
】
时间:2025年11月09日
来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
牙齿年龄估计自动化系统开发及验证,采用全景X光片构建深度学习模型,整合蒙特卡洛滴出与概率模型量化不确定性,覆盖含缺牙、正畸等异常案例的5376例3-17.99岁数据,男女MAE均<0.6年,R2>0.95,异常图像误差差异<0.05年,预测覆盖率达98%。
在法医学领域,牙齿年龄评估是一项至关重要的研究课题,它不仅对人类学研究具有重要意义,而且在司法实践中也发挥着关键作用。牙齿的发育阶段能够为个体的年龄提供可靠的参考依据,尤其是在面对无法通过其他手段明确年龄的案例时。例如,在移民、收养、对已故个体进行年龄推断以及对犯罪嫌疑人进行年龄认定等司法事务中,牙齿年龄评估技术被广泛应用。然而,传统的牙齿年龄评估方法往往依赖于人工判断,这种方法不仅耗时,而且容易受到评估者主观经验的影响,导致结果存在较大的个体差异和不确定性。
近年来,随着人工智能技术的迅速发展,特别是深度学习在图像识别领域的广泛应用,牙齿年龄评估的自动化方法逐渐成为研究热点。深度学习技术能够有效处理复杂的图像数据,提取出牙齿发育的关键特征,并通过训练模型来预测个体的年龄。相较于传统方法,深度学习模型具有更高的效率和更少的主观偏差,能够显著提升牙齿年龄评估的准确性。然而,目前大多数深度学习模型在输出结果时缺乏对预测结果可靠性的解释,通常只提供一个单一的预测值,而没有给出相应的不确定性估计。这种局限性使得模型在实际应用中难以全面评估其预测的可信度,尤其是在面对复杂或异常的牙齿发育情况时。
此外,许多现有的深度学习模型在训练过程中采用了严格的纳入标准,排除了那些存在牙齿缺失、正畸治疗或牙齿异常的案例。这种做法虽然在一定程度上保证了模型的训练数据质量,但也导致了模型在实际应用中的适应性受限。在法医学实践中,牙齿发育情况往往存在较大差异,因此,开发一种能够适应多种牙齿发育状况的模型,对于提升牙齿年龄评估的实用性具有重要意义。为此,本研究提出了一种全新的深度学习框架,旨在解决上述问题,并提高牙齿年龄评估在法医学中的应用价值。
本研究采用全景X光片作为数据来源,通过构建一个包含5376张图像的数据集,涵盖了3.00至17.99岁之间的个体。这些图像不仅包括正常的牙齿发育情况,还特别纳入了牙齿缺失、正畸装置和牙齿修复等异常情况,从而扩展了模型的适用范围。在模型训练过程中,我们引入了蒙特卡洛丢弃(Monte Carlo dropout)与概率建模相结合的方法,以提高预测结果的可靠性。通过这种方法,模型不仅能够输出一个具体的年龄预测值,还能提供预测结果的置信区间,从而为法医学工作者提供更加全面和可靠的参考信息。
实验结果表明,该模型在男性和女性个体中的平均绝对误差(MAE)分别为0.58年和0.59年,且在3.00至8.99岁年龄段内的预测误差控制在0.5年以内。这表明模型在这一关键年龄段的预测性能尤为突出,能够有效满足法医学实践中对年龄评估的高精度需求。在处理异常图像时,模型的预测误差小于0.05年(p > 0.05),进一步证明了其在面对复杂牙齿发育状况时的稳健性。此外,该模型在±3个标准差范围内实现了98%的预测覆盖率,显示出其在实际应用中的广泛适用性。
本研究的主要贡献在于三个方面。首先,我们开发并验证了一种高度准确的深度学习系统,该系统能够处理多种牙齿发育状况的全景X光片,从而克服了传统方法在纳入标准上的限制。其次,我们成功实现了不确定性量化框架,通过结合蒙特卡洛丢弃与概率建模,模型不仅能够提供准确的年龄预测,还能给出相应的置信区间,从而增强预测结果的可信度。第三,我们验证了该模型在法医学实践中的实际应用价值,为司法机构提供了一种高效、可靠的牙齿年龄评估工具。
在数据收集与预处理阶段,我们获得了来自南方医科大学附属南方医院的5437张全景X光片,这些图像涵盖了3.00至17.99岁之间的汉族个体。所有数据均来自于临床用途,并获得了伦理委员会的批准。在数据预处理过程中,我们对图像进行了标准化处理,包括调整亮度、对比度以及去除噪声,以确保模型训练的准确性和稳定性。同时,我们对图像进行了分类,将存在牙齿缺失、正畸装置和牙齿修复等异常情况的图像单独标记为异常案例,以便在模型评估时进行针对性分析。
在图像裁剪和输入方法对牙齿年龄评估性能的影响研究中,我们测试了四种不同的深度学习模型(ResNet18、VGG16、InceptionV3和EfficientNet-B4)在不同图像裁剪策略下的表现。实验结果表明,所有模型-裁剪组合均表现出令人满意的预测性能,其平均绝对误差(MAE)均低于0.7年,且决定系数(R2)均超过0.93。其中,原始图像裁剪(Method a)展现出明显的优势,因为它能够保留全景X光片中完整的牙齿结构特征,从而为模型提供更加丰富的信息。与其他裁剪方法相比,原始图像裁剪在保持图像完整性的同时,也有效避免了信息丢失的问题,进一步提高了模型的预测精度。
为了验证模型的性能,我们对正常图像和异常图像进行了对比分析。结果显示,模型在处理异常图像时的预测误差与处理正常图像时的误差相比,差异小于0.05年(p > 0.05),这表明模型在面对牙齿缺失、正畸治疗和牙齿修复等复杂情况时,依然能够保持较高的预测准确性。这一结果对于法医学实践具有重要意义,因为实际案例中常常会遇到各种牙齿发育异常的情况,而这些情况在传统方法中往往被排除在外。通过引入蒙特卡洛丢弃与概率建模相结合的不确定性量化框架,我们不仅提高了模型的预测能力,还增强了其在实际应用中的适应性。
本研究还对模型的预测结果进行了详细的统计分析,以评估其在不同年龄段的表现。结果显示,该模型在3.00至8.99岁年龄段内的预测误差显著低于其他年龄段,这一现象可能与该年龄段牙齿发育的稳定性有关。在9.00至17.99岁年龄段,模型的预测误差略有增加,但依然保持在可接受的范围内。通过对比不同模型在不同裁剪策略下的表现,我们发现原始图像裁剪方法在所有模型中均表现出最佳的预测性能,这进一步验证了该方法在牙齿年龄评估中的有效性。
在模型的不确定性量化方面,我们采用蒙特卡洛丢弃方法,通过在训练过程中引入随机丢弃神经网络中的部分节点,使得模型在预测时能够输出一个概率分布,从而反映预测结果的不确定性。这种方法不仅能够提高模型的鲁棒性,还能为法医学工作者提供更全面的参考信息。通过概率建模,我们能够计算出预测结果的置信区间,从而帮助评估者更好地理解预测结果的可靠性。这种不确定性量化框架的应用,使得模型在处理复杂牙齿发育状况时,能够提供更加科学和合理的预测结果。
本研究的最终目标是为法医学实践提供一种高效、可靠且适应性强的牙齿年龄评估工具。通过引入不确定性量化框架,我们不仅提高了模型的预测精度,还增强了其在实际应用中的适用性。此外,模型在处理异常图像时表现出的高稳健性,也表明其能够有效应对法医学实践中常见的牙齿发育复杂情况。这种深度学习框架的应用,为司法机构在进行年龄评估时提供了更加科学和客观的依据,同时也为未来的研究提供了新的方向和思路。
总的来说,本研究通过构建一个包含多种牙齿发育状况的深度学习模型,解决了传统方法在纳入标准和预测准确性方面的局限性。模型在处理正常和异常图像时均表现出良好的性能,且在关键年龄段的预测误差控制在较低水平。通过引入不确定性量化框架,模型不仅能够提供准确的年龄预测,还能为评估者提供相应的可靠性参考。这种深度学习框架的应用,将极大地推动牙齿年龄评估技术在法医学领域的进一步发展,为司法实践提供更加精准和高效的工具。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号