用于从长骨中个性化估计性别的可解释机器学习方法

《International Journal of Legal Medicine》:Interpretable machine learning for individualized sex estimation from long bones

【字体: 时间:2025年10月26日 来源:International Journal of Legal Medicine 2.3

编辑推荐:

  性别估计是法医人类学核心任务,本研究通过2969例长骨测量数据集评估12种机器学习算法,发现线性判别分析(LDA)准确率达95.2%。创新性地整合SHAP解释框架,实现模型可解释性突破,为法庭证据AI化提供理论支撑。

  

摘要

性别鉴定是法医人类学中的一项重要任务。它不仅对于从骨骼遗骸中识别个体至关重要,而且对于提高其他生物特征估计方法(如年龄和身高)的可靠性也非常重要,因为某些方法在考虑性别因素时表现更好。本研究探讨了将机器学习(ML)技术应用于性别鉴定的方法,特别关注模型的可解释性,以解决人工智能模型固有的“黑箱”问题。使用来自2,969名个体的多样化长骨测量数据集,评估了12种不同的ML算法。缺失数据通过迭代回归插补方法进行处理,但数据集不完整所带来的挑战凸显了改进数据处理策略的必要性。线性判别分析(LDA)被证明是最准确的方法,准确率达到95.2%。本研究的一个关键特点是整合了SHapley加性解释(SHAP)值,这些值能够提供对影响每个预测因素的个性化见解。这种可解释性框架确保了透明度,并解决了关于人工智能生成证据在法庭上可接受性的法律和科学问题。事实上,误分类的可能性突显了在法医应用中清晰、易于理解模型的重要性。研究强调了个性化预测的重要性,通过展示每个个体的男性或女性分类概率以及缺失值对预测准确性的影响来加以说明。这项研究表明,ML模型能够有效平衡准确性和可解释性,为法医调查提供个性化且可操作的见解。它为满足科学严谨性和法律标准的人工智能驱动方法铺平了道路,通过提供适用于法庭的个性化、可辩护的证据,改变了法医科学中的性别鉴定方式。

性别鉴定是法医人类学中的一项重要任务。它不仅对于从骨骼遗骸中识别个体至关重要,而且对于提高其他生物特征估计方法(如年龄和身高)的可靠性也非常重要,因为某些方法在考虑性别因素时表现更好。本研究探讨了将机器学习(ML)技术应用于性别鉴定的方法,特别关注模型的可解释性,以解决人工智能模型固有的“黑箱”问题。使用来自2,969名个体的多样化长骨测量数据集,评估了12种不同的ML算法。缺失数据通过迭代回归插补方法进行处理,但数据集不完整所带来的挑战凸显了改进数据处理策略的必要性。线性判别分析(LDA)被证明是最准确的方法,准确率达到95.2%。本研究的一个关键特点是整合了SHapley加性解释(SHAP)值,这些值能够提供对影响每个预测因素的个性化见解。这种可解释性框架确保了透明度,并解决了关于人工智能生成证据在法庭上可接受性的法律和科学问题。事实上,误分类的可能性突显了在法医应用中清晰、易于理解模型的重要性。研究强调了个性化预测的重要性,通过展示每个个体的男性或女性分类概率以及缺失值对预测准确性的影响来加以说明。这项研究表明,ML模型能够有效平衡准确性和可解释性,为法医调查提供个性化且可操作的见解。它为满足科学严谨性和法律标准的人工智能驱动方法铺平了道路,通过提供适用于法庭的个性化、可辩护的证据,改变了法医科学中的性别鉴定方式。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号