综述:从微生物数据到法医见解:用于死亡时间(PMI)估计的机器学习模型的系统综述

【字体: 时间:2025年04月23日 来源:Forensic Science, Medicine and Pathology 1.5

编辑推荐:

  本文系统回顾了利用机器学习模型估计死亡时间(PMI)的研究。传统 PMI 估计方法易出错,新的分子和微生物技术结合机器学习可提升准确性。研究筛选多篇文献,对比不同模型性能,发现随机森林(RF)模型结合 16S rRNA 和土壤样本效果较好,但仍需标准化和验证。

  

背景


在法医案件中,准确估计死亡时间(Post-Mortem Interval,PMI)对构建案件时间线至关重要。然而,传统的 PMI 估计方法存在明显缺陷,一方面依赖证人证词,而证词可能存在不准确、遗漏或故意隐瞒等问题;另一方面,所依据的生物标记物对环境因素极为敏感,环境的温度、湿度、酸碱度等变化,都可能干扰生物标记物的正常变化规律,进而导致估计误差较大。

近年来,新的分子和微生物技术崭露头角,为 PMI 估计带来了新的曙光。比如,DNA 降解模式能从遗传物质层面反映尸体的变化过程,细菌群落分析则聚焦于尸体周围微生物群落的动态演变,这些技术在准确性和可靠性上相较于传统方法有显著提升。而机器学习技术的加入更是如虎添翼,它可以深度挖掘复杂的微生物数据背后隐藏的规律,进一步优化 PMI 的估计。但目前不同器官、不同环境下基于微生物组的 PMI 预测,以及不同机器学习技术之间的比较尚不明确,本综述旨在填补这一空白。

方法


研究团队进行了全面且系统的文献检索,检索范围涵盖了 PubMed、Scopus、Web of Science、IEEE 和 Cochrane Library 等多个权威数据库,时间跨度截至 2024 年 9 月。为确保数据提取的准确性和客观性,由两名独立的评审人员对符合条件的研究进行数据提取,提取的数据丰富多样,包括研究对象的数量和物种、所使用的组织样本类型、研究涉及的 PMI 范围、运用的机器学习算法,以及最重要的模型性能表现等关键信息。

结果


经过严格的筛选流程,从五个数据库中初步收集到 1252 条记录,剔除 750 条重复记录后,对剩余的记录进行标题和摘要筛选,筛选出 43 条记录进行资格评估,最终确定 28 篇文章纳入研究。

研究人员依据误差指标和解释方差对用于 PMI 估计的机器学习模型进行了综合评估和排名,评选出表现最为优异的前五名模型。其中,Wang(2024)运用随机森林(Random Forests,RF)模型取得了令人瞩目的成果,平均绝对误差(Mean Absolute Error,MAE)仅为 6.93 小时;Liu(2020)采用神经网络模型,MAE 为 14.483 小时;Cui(2022)以土壤样本为研究对象,利用模型预测长达 36 天的 PMI,MAE 为 1.27 天;Yang(2023)同样借助土壤样本和 RF 模型,在夏季和冬季分别实现了 1.567 天和 2.001 天的 MAE;Belk(2018)基于春季土壤样本和 16S rRNA 数据构建 RF 模型,在 142 天的 PMI 范围内,达到了 48 累积日度(Accumulated Day Degrees,ADD)(约 3 - 5 天)的 MAE。

结论


机器学习模型,尤其是随机森林(RF)模型,在结合 16S rRNA 数据和土壤样本时,展现出了强大的 PMI 估计能力,为法医实践提供了更为精准的技术支持。不过,当前模型仍存在一定的提升空间,要想进一步优化模型性能,需要在不同的法医环境下进行广泛的标准化参数设定和验证工作。只有这样,才能确保模型在各种复杂多变的实际场景中都能稳定、准确地发挥作用,推动基于微生物数据的 PMI 估计技术从实验室走向更广泛的法医应用领域。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号