现场爆炸物检测犬：一项多地点的“黑箱”验证研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Frontiers in Veterinary Science》：Explosive detection canines in the field: a multi-site black box validation study

【字体：大中小】 时间：2025年10月17日 来源：Frontiers in Veterinary Science 2.9

编辑推荐：

　　爆炸犬训练认证标准OSAC 092实证研究及效果评估。采用三个地区56个警犬团队进行黑盒测试，对比标准认证测试与真实场景操作效果。结果显示标准测试通过率仅5%，但标准达标团队在真实场景表现优异（86% vs 79%）。研究发现：1） parcel测试中包装方式影响检出率；2）假阳性主要来自锐器类 distractors；3）爆炸物种类训练频率影响检出率。

　　### 介绍

在2009年，美国国家研究委员会（National Research Council, NRC）呼吁法医学界采取行动，推动最佳实践和指南的标准化，以确保证据的收集和分析在该领域内具有一致性和高质量。为了应对这一需求，科学领域委员会组织（Organization of Scientific Area Committees for Forensic Science, OSAC）成立，负责协调法医学各学科的最佳实践和标准的制定。其中，OSAC的“犬与传感器”子委员会专注于标准化犬类探测团队的培训和认证流程。尽管全球范围内对制定和推广此类标准的努力仍在持续，但目前所开发的评估方法在培训和实际操作场景中尚未经过实证验证。因此，一项概念验证的“黑箱”研究被开展，以评估OSAC爆炸物犬类探测标准的有效性。这项研究在三个不同的地理区域进行了评估，共涉及56支犬与训导员团队，持续两天，包括符合ANSI/ASB标准092的爆炸物探测任务，以及更贴近实际操作场景的测试。总体而言，研究结果显示，没有一支团队能够通过OSAC的认证，但各团队在两种评估类型（标准评估和操作场景）中的表现相似。此外，团队在六种不同的爆炸物上的表现存在显著差异，这表明训练材料的多样性可能是导致表现差异的关键因素。这些发现表明，标准评估可能能够预测实际操作中的表现，并且团队在培训中接触的材料种类会影响其在不同爆炸物上的探测能力。

### 方法

本研究的实验设计旨在通过“黑箱”方法评估犬类探测团队在实际操作中的表现。所有实验流程均经过伦理审查，并获得德克萨斯理工大学和佛罗里达国际大学的机构动物护理与使用委员会（Institutional Animal Care and Use Committee, IACUC）的批准。研究分为三个试验，分别在美国内部的西南、东南和西部地区进行，每个试验持续两天，覆盖不同的测试环境。试验地点的选择基于设施的可用性和标准所规定的空间要求。西南试验在一座办公楼内进行，东南试验在一所大学内，而西部试验则在一所监狱中。试验中的搜索区域因地点而异，但尽可能保持一致性，以确保数据的可比性。

试验的结构包括两部分：第一部分是符合ANSI/ASB标准092的认证测试，第二部分则是模拟实际操作环境的场景测试。在标准测试中，犬与训导员团队需要在房间、包裹、车辆外部和行李等环境中完成探测任务，同时还需要进行气味识别测试（Odor Recognition Test, ORT）。场景测试则更接近真实操作环境，包括更复杂的障碍物和隐藏的爆炸物。为了减少气味交叉污染，所有爆炸物均被单独称重，并放置在防静电袋中，再放入独立的金属漆桶中，每个桶都经过密封处理。在进行下一爆炸物的准备之前，试验区的表面会被酒精擦拭并晾干。所有试验均采用单盲设计，即评估人员知道爆炸物的布置和数量，而训导员则不知道。每个试验的犬与训导员团队的搜索顺序是随机安排的，以确保公平性。团队不得提前查看试验场地，也不能观察其他团队的搜索过程。每项搜索都有两名评估人员在场，并在每次搜索前向团队说明搜索区域和时间限制。

数据收集和分析方面，所有评估人员的评分表被汇总并进行对比，犬类的反应被记录在Excel表格中。正向警报率（positive alert rate）通过整个试验中所有正向警报次数除以爆炸物出现的总次数计算得出。误报率（false alert rate）则通过整个试验中所有误报次数除以空白和干扰物出现的总次数来计算。统计分析采用卡方检验（Chi-square test）来比较不同试验之间的表现，以及标准测试和操作场景之间的差异。如果显著性水平（p值）小于或等于0.05，则认为结果具有统计学意义。此外，研究还提供了更复杂的多水平逻辑回归分析，以考虑犬与训导员团队和试验地点等因素对表现的影响，但这些分析结果与卡方检验一致，因此在本文中仅呈现较为简洁的分析结果。

### 结果

试验结果显示，犬与训导员团队在不同试验中的表现存在显著差异。总体来看，第二试验（东南地区）的团队在标准测试和实际操作场景中的正确警报率均最高，而第一试验（西南地区）和第三试验（西部地区）的正确警报率则显著低于第二试验。此外，第三试验的团队在实际操作场景中的表现似乎不如标准测试中的表现，这表明不同地区的团队可能在应对真实操作环境时存在一定的适应性差异。在六种爆炸物的检测表现上，第二试验的团队在标准测试和实际操作场景中均表现出较高的正确警报率，而第三试验的团队则在某些爆炸物上表现不佳，例如爆炸物2的正确警报率从第一天的92%下降到第二天的35%。这表明，某些爆炸物的训练频率可能影响团队的检测能力。

在误报率方面，试验一和试验二的团队在标准测试和实际操作场景中的误报率均较低，但试验二的误报率明显高于试验一和试验三。这一现象可能与团队在试验中的警报倾向有关，即试验二的团队可能更倾向于频繁警报，导致误报率升高。同时，试验三的团队在某些干扰物上表现出较高的误报率，这可能与训练材料的多样性不足有关。例如，某些干扰物如马克笔和防静电袋的误报率较高，这表明这些材料在训练中可能被过度强调，导致犬类对它们产生偏好。

此外，试验中的包裹搜索任务成为一项特别具有挑战性的评估内容。在试验一中，团队在第一天对包裹中的爆炸物的检测率仅为5%，但在第二天通过多次练习后，检测率大幅提升至67%。试验二中，包裹搜索的检测率在第一天为70%，第二天则达到100%。这一结果表明，团队在面对封闭的包裹时可能需要更多的训练和适应时间。因此，建议在训练和认证过程中使用封闭的包裹，以更好地模拟实际操作环境。

### 讨论

从整体表现来看，犬与训导员团队在标准测试和实际操作场景中的表现存在显著差异。这可能反映了标准测试的严格性和实际操作环境的复杂性之间的差距。标准测试虽然提供了可控和一致的环境，但其缺乏真实场景中的不确定性和干扰因素，这可能导致某些团队在标准测试中表现良好，但在实际操作中表现不佳。然而，试验结果显示，标准测试的正确警报率和实际操作场景的正确警报率之间存在一定的相关性，表明标准测试可能在一定程度上能够预测团队在实际操作中的表现。

在团队表现方面，尽管大多数团队未能达到OSAC认证的90%正确警报率和10%误报率的标准，但部分团队在标准测试中表现出较高的能力。例如，试验二中的团队9在标准测试中达到了88%的正确警报率和6%的误报率，这表明该团队在标准测试中表现优异。然而，其他团队在标准测试中的表现则相对较低，这可能与训练材料的多样性有关。一些爆炸物在日常训练中出现的频率较低，导致团队在这些材料上的检测能力不足。因此，建议在训练和认证过程中使用多种爆炸物，以提高犬类对不同材料的适应性和检测能力。

此外，试验中的干扰物和空白材料对团队的表现也产生了显著影响。某些干扰物如马克笔和防静电袋的误报率较高，这可能与这些材料在训练中被频繁使用有关。因此，建议在训练过程中引入更多样化的干扰物和空白材料，以提高犬类的识别能力。同时，试验中发现，团队在面对封闭的包裹时表现不佳，这可能与日常训练中较少使用封闭的包裹有关。因此，建议在训练和认证过程中使用封闭的包裹，以更好地模拟实际操作环境。

### 限制与未来研究方向

尽管本研究提供了有价值的见解，但也存在一些局限性。首先，试验的时间安排和空间要求较为严格，导致某些小型机构难以开展。其次，试验未采用双盲设计，评估人员可能无意中向训导员提供关于目标位置的线索，这可能影响犬类的表现并导致结果偏差。此外，研究未直接测量犬类和训导员的认知或生物状态变量，如训练质量、身体状况和情绪状态，这些因素可能对检测结果产生影响。例如，训练材料的质量和数量、训导员的搜索模式以及犬类的兴奋度和动机都可能影响其表现。

未来的研究可以进一步探讨这些因素对犬类探测能力的影响，并考虑在不同地理区域开展更多试验，以更全面地了解犬类探测团队的表现差异。此外，还可以扩展研究范围，涵盖其他检测领域，如非法物质和人体遗骸的探测，以建立更坚实的实证基础。通过这些研究，可以更好地理解犬类探测团队在不同环境下的表现，并为制定更有效的标准和培训方案提供科学依据。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号