《Microchemical Journal》:Multimodal fusion of stable isotope and infrared spectral data based on a GMM–ReliefF–BP framework: a novel approach for intelligent source attribution of plastic evidence in forensic science
编辑推荐:
本研究提出一种多模态融合决策框架,结合稳定同位素(δ13C、δ2H)分析与ATR-FTIR光谱,解决单模态技术区分相似塑料物证的能力不足问题。通过无监督聚类生成伪标签,并采用ReliefF-BP模型实现94.19%的样本级内部验证准确率。主要局限为样本量小(n=28)、伪标签不确定性及缺乏外部验证集,未来需扩大样本量和验证体系。
蔡卓通|朱军|聂昭伟|张从和|徐傲翔|郑汉阳|王伟|胡灿|李亚军|梅洪成
中国人民公安大学刑事侦查学院,北京100038,中国
摘要
在法医鉴定中,塑料薄膜和塑料袋是常见的样本。它们的光谱和整体成分可能非常相似,而且通常缺乏可验证的来源标签。本研究开发了一种决策级多模态融合工作流程,通过化学计量建模将稳定同位素信息与ATR-FTIR光谱联系起来。分析了28个来自中国的塑料袋样本,使用EA-IRMS测量了δ13C、δ2H和元素C/H含量,并在4000–600 cm?1范围内收集了ATR-FTIR光谱。在同位素特征空间中进行了无监督聚类(K-means、层次聚类、BIRCH、DBSCAN和高斯混合模型),以生成基于同位素的伪标签。然后从FTIR数据中预测这些伪标签,以量化跨模态的可关联性和。比较了几种特征选择和分类策略,包括SVM-RFE、ELM、SDAE、LSTM和ReliefF-BP。模型评估采用了袋级分组分割方法,以防止同一袋子的多个光谱分布在训练集和测试集中,从而减少由于光谱伪复制导致的泄漏。最佳性能是由高斯混合模型伪标签与ReliefF-BP结合获得的,在内部验证下的样本级准确率为94.19%。这一结果表明,FTIR光谱能够捕捉到与该数据集中基于同位素的分层一致的模式。所报告的性能反映了预测同位素定义组的内部一致性,但不构成对制造商归属的外部验证。主要限制是样本量较小(n = 28)、伪标签的不确定性以及缺乏独立的外部测试集。未来的工作应使用更大且地理分布更广泛的参考样本集,并包含不确定性报告或开放集(“不确定”)决策。
引言
塑料作为一种轻质、耐用且用途广泛的材料[1],在许多应用中发挥着关键作用,在环境保护、食品安全和法医学[2][3][4]中具有重要意义。在法医背景下,塑料和塑料制品是犯罪现场最常遇到的物证之一。典型的例子包括从爆炸现场回收的塑料碎片[5]、用于掩盖或丢弃尸体的塑料袋[6],以及用于毒品贩运包装的塑料薄膜[7]。通过将现场收集的塑料证据与疑似参考物品进行比较和区分,调查人员可以建立关联并推断材料的来源,从而提供关键的调查线索,缩小调查范围,并为嫌疑人识别和案件特征提供科学支持。
然而,从来源归属角度分析塑料微量证据仍然具有挑战性。现有的方法(如基于物理特性的初步筛选[8]、SEM/EDS[9]、光谱方法[10]和热分析[11])已被广泛用于聚合物类型鉴定、形态和成分特征描述以及配方差异筛选。这些技术框架相对成熟,在快速区分和多维分析方面表现出很强的适用性和鲁棒性。
然而,在更细致的法医场景中,当来自不同来源的样本具有相同的聚合物类型、相似的配方系统、加工路径或老化/污染背景时,区分难度显著增加。在这种情况下,传统的检测结果往往无法提供足够的信息来可靠地确定制造商、生产批次或地理来源。
近年来,稳定同位素分析和红外光谱技术已被应用于法医来源归属。然而,在处理复杂的塑料证据时,单一模态技术存在特定瓶颈,难以满足法医学对准确可靠来源确定的严格要求。稳定同位素分析作为一种强大的证据来源追踪方法,在法医应用中显示出巨大潜力。利用同位素分馏效应和地理变异,该技术可以检测特定元素的同位素“指纹”[12],并已广泛应用于法医科学中的物证来源归属[13][14]。关于聚合物微量证据,英国和澳大利亚的实验室对用于包装海洛因的保鲜膜进行了来源研究[15][16],初步证明了同位素比值质谱(IRMS)在区分塑料证据来源方面的可行性。然而,在实际案件中,石化供应链的全球化和整合意味着不同品牌的塑料产品可能来自相同的上游原料来源。因此,它们的同位素特征可能落在相同的数值区间内,导致“不同来源相同值”的现象。在这种情况下,仅凭同位素数据往往不足以区分特定制造商。同时,衰减全反射傅里叶变换红外光谱(ATR-FTIR)可以可靠地识别聚合物类别(例如聚乙烯和聚丙烯),但在高度相似的物品之间进行精细来源归属时存在明显的“区分盲点”。先前的研究表明,不同制造商生产的相同类型塑料袋的红外光谱往往高度一致[17]。此外,当应用于复杂样本或混合系统时,红外光谱的归属准确性受到仪器光谱分辨率和信号间大量交叉干扰的限制。具体来说,相似塑料中主要聚合物基质的强吸收带通常会重叠;这种光谱卷积掩盖了由微量添加剂或加工条件引入的细微特征。因此,传统的光谱匹配算法往往无法捕捉到品牌间的细微差异,限制了其在精确来源推断中的实用性[18]。此外,环境因素(如湿度和老化)引起的基线漂移会进一步掩盖这些微弱的指纹信号[19]。因此,为了解决单一模态方法的两个根本性问题——即“光谱特征的广泛重叠”和“同位素值的统计模糊性”——开发一个多模态决策框架至关重要,该框架将化学结构信息与原子级指纹识别相结合,从而克服高度相似塑料证据的来源归属瓶颈[20][21]。
在实际涉及塑料微量证据的案件中,可靠的真实标签(例如,经过验证的制造商或生产线)往往不可用、不完整或难以验证。这种限制部分是因为塑料产品可能看起来非常相似,而它们的上游原料来源、添加剂配方和加工条件可能存在显著差异。此外,即使在同一制造商内部,批次间的变化和供应链波动也可能引入明显的类别内异质性。在这种情况下——特别是当数据集较小且来自相对同质的来源时——依赖固定标签系统的分类框架可能会变得不稳定并容易产生偏差。
因此,我们首先在同位素特征空间中应用无监督聚类来推导数据驱动的“同位素指纹组”(代理类别),而不预先指定来源类别。这些潜在组随后被用作跨模态对齐的实际中间表示,使红外光谱能够预测同位素一致的组成员身份,从而支持快速筛选和比较评估。重要的是,在缺乏独立来源验证和真实案例样本验证的情况下,这些代理类别不应被解释为确定的制造商级来源标签。
基于这些考虑,我们提出了一个多模态决策级数据融合框架,将同位素特征与红外光谱信息结合起来,以实现法医背景下塑料微量证据的比较分析。整个工作流程如图1所示。这种方法对法医科学界具有重要意义。首先,它克服了任何单一技术在处理高度相似证据时的局限性;通过利用互补的“同位素–红外”信息,显著增强了证据关联的区分能力和排他性。其次,所提出的数据驱动的“替代分类”策略为实际调查中的案件关联和初步线索筛选提供了实用解决方案,因为在这些情况下可靠的制造商标签往往不可用,从而帮助调查人员迅速缩小调查范围。总体而言,本研究为构建智能的高维微量证据来源系统奠定了方法论基础,并将法医学从传统的定性评估推向精确的智能决策支持。
仪器和试剂
本研究使用了HYPERION 3000傅里叶变换红外(FTIR)显微镜(Bruker,德国);Flash EA 2000元素分析仪、253 Plus同位素比值质谱仪(IRMS)和ConFlo IV连续流接口(均来自Thermo Scientific,美国);以及XPR2电子天平(Mettler Toledo,瑞士)。
通过目的性采样,收集了来自中国不同制造商的28个塑料袋产品(图2),涵盖了多个地区和购买渠道
塑料袋样本的同位素和红外特性
图3(a)显示了28个塑料袋样本的碳(δ13C)和氢(δ2H)同位素值之间的关系,气泡图用于表示每个样本的绝对碳和氢含量。气泡大小表示绝对氢含量的变化,而气泡颜色反映了绝对碳含量的变化。可以看出,δ2H值的范围是从?151.23‰到?5.65‰,δ13C值的范围是从?35.04‰到?26.93‰。结果表明,这些样本表现出
结论
在法医学中,物证的来源归属长期以来一直受到同一类别但不同来源物品之间的根本性挑战的阻碍。为了解决这一瓶颈,本研究提出了一种基于决策级融合的多模态框架,将稳定同位素测量与塑料袋证据的ATR-FTIR光谱信息相结合。这种方法建立了高通量光谱筛选与
CRediT作者贡献声明
蔡卓通:撰写——原始草稿,正式分析,数据管理。朱军:调查,资金获取,正式分析。聂昭伟:正式分析,数据管理。张从和:正式分析,数据管理。徐傲翔:数据管理。郑汉阳:数据管理。王伟:正式分析。胡灿:调查,正式分析。李亚军:正式分析。梅洪成:资金获取。
未引用参考文献
[29], [30], [31], [32], [33]
利益冲突声明
作者声明他们没有已知的可能会影响本文工作的财务利益或个人关系。
致谢
本研究得到了公安部(2024JSZ14)技术研究计划项目的支持。