基于机器学习的牙龄与骨龄融合评估模型在法医未成年人年龄鉴定中的优化研究

《Forensic Imaging》:AI-assisted age estimation in children based on a combination of bone and tooth maturity

【字体: 时间:2025年10月18日 来源:Forensic Imaging 1

编辑推荐:

  本研究针对法医实践中未成年人年龄鉴定准确性问题,开发了基于随机森林(m-RF)和梯度提升(m-Boo)的机器学习算法,通过整合Demirjian 7牙法(D)、Demirjian 8牙法(D-8)、Willems牙龄法(W)、Greulich-Pyle骨龄法(GP)和Tanner-Whitehouse RUS-3骨龄法(TW3)五种评估方法,显著提升了年龄预测精度。结果表明,m-Boo算法在测试样本中达到227.19天的平均绝对误差(MAE),其95%置信区间的预测区间为±1.48年,优于传统单一方法。该研究为法医年龄鉴定提供了更可靠的多参数融合评估方案,对解决未成年人法律身份争议具有重要实践意义。

  
(以下为论文解读文章,约2000字)
在当今全球移民潮和跨国法律事务日益频繁的背景下,未成年人年龄鉴定成为法医科学领域一个极具挑战性的课题。无论是寻求庇护的难民,还是涉及刑事或民事案件的个体,当缺乏可靠出生证明时,准确评估其真实年龄直接关系到法律权益的保障。例如,是否以未成年人身份受审、能否获得特殊保护等,都依赖于科学的年龄鉴定结果。目前,国际通行的法医年龄鉴定协议建议结合牙龄和骨龄两种方法进行评估,通常通过口腔全景片(OPG)和手腕X光片来实现。牙龄评估常用Demirjian法、Willems法等,通过观察牙齿钙化阶段;骨龄评估则采用Greulich-Pyle(GP)图谱法或Tanner-Whitehouse(TW3)计分法等,依据手腕骨骼的成熟度。然而,这种"双管齐下"的方法在实践中面临两大难题:一是伦理争议,让生长发育中的未成年人接受两次X光照射(牙齿和手腕)是否必要;二是科学上尚未证实,将两种评估结果简单结合是否能真正提高最终年龄判断的准确性。现有研究显示,骨龄评估在低龄儿童中较为准确,而牙龄评估在青少年后期可能更具优势,但如何优化整合这两种独立发育指标,一直是法医年龄鉴定领域的瓶颈问题。
为此,研究团队在《Forensic Imaging》期刊上发表了一项创新研究,探索利用机器学习算法融合牙龄和骨龄评估,以提升未成年人年龄鉴定的精准度。研究人员收集了449名6-20岁已知年龄个体的同期口腔全景片和手腕X光片,由专业操作者分别应用三种牙龄评估方法(Demirjian 7牙法D、Demirjian 8牙法D-8、Willems法W)和两种骨龄评估方法(Greulich-Pyle法GP、Tanner-Whitehouse RUS-3法TW3)进行年龄评估。随后,他们开发了两种机器学习模型——随机森林(m-RF)和梯度提升(m-Boo),使用70%的样本数据训练算法,优化关键参数,并在剩余30%的测试样本上验证模型性能。研究通过比较平均绝对误差(MAE)和均方误差(MSE),并计算不同置信水平下的预测区间,全面评估了融合模型的优势。
关键技术方法包括:1)基于449名6-20岁意大利人群的同期口腔全景片和手腕X光片样本;2)五位专业操作者独立应用五种标准牙龄和骨龄评估方法;3)采用随机森林和梯度提升两种机器学习算法进行模型训练与优化;4)使用Rosner异常值检验和10折交叉验证确保数据可靠性;5)通过Kruskal-Wallis检验和Benjamini-Hochberg校正进行统计学比较。
研究结果显示,传统方法中骨龄评估法(GP和TW3)的整体准确性优于牙龄评估法,其中TW3法表现最佳(MAE为257.88天)。在牙龄评估法中,Demirjian 7牙法(D)和Willems法(W)性能相近,而Demirjian 8牙法(D-8)误差较大。这一结果与既往研究一致,证实了骨龄评估在儿童及青少年前期(<14岁)的优势。然而,更引人注目的是机器学习模型的突破性表现:梯度提升模型(m-Boo)在测试样本中实现了227.19天的MAE和189.58天的标准差,不仅显著优于所有牙龄评估法,也比性能最佳的TW3骨龄评估法提升了约12%的准确率。随机森林模型(m-RF)虽稍逊于m-Boo,但仍展现出优于传统方法的融合能力。统计学分析进一步证实,m-Boo算法与传统方法间的差异具有显著性(p<0.05),其与TW3法的两两比较显示m-Boo有90%的概率更具优势。
尤为重要的是,研究团队为m-Boo模型计算了不同置信水平的预测区间:在95%置信水平下,预测区间为±1.48年(1087天);在90%置信水平下,缩窄至±1.26年(925天);而50%置信水平的预测区间更是精确到±5.5个月(344天)。与传统方法相比(如Demirjian 7牙法94%置信区间为±1.45-2.25年,TW3法94%置信区间为±1.9-2年),m-Boo模型将年龄鉴定的不确定性显著降低,这意味着在法医实践中,专家能够以更小的误差范围给出年龄评估结果,大幅提升鉴定结论的可靠性。
研究结论与讨论部分强调,该研究首次通过机器学习算法成功验证了牙龄与骨龄融合评估的科学价值。梯度提升模型(m-Boo)通过智能整合五种独立的成熟度指标,不仅克服了单一方法的局限性,还实现了"1+1>2"的优化效果。这一突破具有三重重要意义:首先,在科学层面,它证实了多参数融合策略在法医年龄鉴定中的优越性,为后续研究指明了方向;其次,在伦理层面,尽管融合评估需要牙科和骨骼两次X光检查,但显著提升的准确性为这一做法提供了科学依据,有助于平衡辐射风险与鉴定精度之间的伦理争议;最后,在实践层面,研究开发的机器学习工具使法医专家能够量化评估结果的误差范围,明确告知法庭鉴定结论的不确定性程度,极大增强了证据的法律效力。
值得注意的是,该研究也存在一定局限性,如样本年龄分布不均,对青少年后期(>15岁)人群的验证尚不充分。未来研究可进一步扩大样本量,细分年龄队列进行分析,并探索基于计算机视觉的自动化评估系统,直接从X光图像中提取特征,减少人为评估的主观性。总之,这项研究为法医年龄鉴定领域提供了创新的技术路径,通过机器学习赋能多参数融合评估,有望在保障未成年人权益的法律实践中发挥重要作用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号