《Forensic Science International: Genetics》:Using hierarchical Bayesian modelling to assess shedder test suitability
编辑推荐:
痕量DNA分析的进步,结合对微量DNA检测能力的提升,促使研究界有必要投入研究以理解与DNA转移、持续、普遍存在与回收(DNA-TPPR)相关的因素,其中包括个体沉积其痕量DNA的能力,称为其脱落者状态。当前,脱落者测试及评估方法存在变异性,加之常规发表的数据
痕量DNA分析的进步,结合对微量DNA检测能力的提升,促使研究界有必要投入研究以理解与DNA转移、持续、普遍存在与回收(DNA-TPPR)相关的因素,其中包括个体沉积其痕量DNA的能力,称为其脱落者状态。当前,脱落者测试及评估方法存在变异性,加之常规发表的数据有限,这限制了科学家在案件工作情境中利用此类数据的能力,同时也引发了关于今后众多方法中何者最适宜的问题。
在本研究中,研究人员考察了5名个体在握持塑料管时的痕量DNA沉积情况,设置了若干与洗手后间隔时间相关的最常见条件:未洗手、洗手后15分钟和洗手后1小时。每种方法进行了5次重复,目的在于发展一种当可获得数据有限时用于判定最佳脱落者测试的方法。研究采用分层贝叶斯建模(HBM)比较了5种不同的数据建模结构。研究人员选择支持度最高的模型,用以揭示各脱落者测试方法的表现,并最终选出用于判定脱落者状态的最佳方法。贝叶斯建模方法在特定情境下具有优势,因为其可提供参数的后验分布(posterior parameter distributions),从而避免二元化的显著性解释。
本研究所述模型结果显示,方法3(洗手后1小时)最适于对受试者进行脱落者分类。该方法最接近个体的自然行为,同时仍保留一定程度的方案标准化。
研究人员利用本研究数据构建了一个脱落者分布,并展示了如何将个体在该脱落者分布中的位置知识纳入评估框架,例如可用于基于活动层面命题(activity level propositions)评估观察结果的贝叶斯网络(Bayesian network)之中。
该论文发表于《Forensic Science International: Genetics》,聚焦于法医痕量DNA研究中“脱落者状态”测定方法的标准化与实用化问题。随着痕量DNA检验灵敏度不断提高,法医实践已不仅关注是否检测到DNA,更开始追问这些微量DNA如何转移、在何处残留、以何种方式被回收,即DNA转移、持续、普遍存在与回收(DNA-TPPR)问题。在这一框架下,个体间接触后DNA沉积能力差异,即所谓脱落者状态,成为解释活动层面证据的重要因素。既往研究普遍认为不同个体的DNA脱落倾向确有差异,但如何可靠、稳定、可比较地测定这种差异,仍缺乏统一方案。现有研究在洗手方案、等待时间、接触材料、接触方式以及分类标准上存在较大差异,而且样本量通常偏小、重复次数有限,导致研究结果难以互相比较,也限制了其在真实案件评估中的应用价值。因此,开展本研究的必要性在于:在小样本、有限重复这一法医研究常见现实条件下,建立一种能够稳健比较不同脱落者测试方法优劣的分析框架,并据此筛选更适合表征个体脱落倾向的方法。
研究人员围绕4种常见脱落者测试条件开展实验,比较其区分不同个体脱落倾向的能力。这4种方法分别为:洗手后戴手套15分钟取样、洗手后15分钟握持塑料管、洗手后1小时握持塑料管,以及未洗手直接握持塑料管。5名参与者在每种条件下各完成5次重复,共获得100份样本。研究核心并非单纯比较哪一种条件能收集到更多DNA,而是评估哪一种方法更适合稳定地区分个体间脱落能力差异。为此,作者引入分层贝叶斯建模(HBM),比较5种模型结构,包括是否纳入个体与方法交互项、是否引入层级结构、是否允许不同方法拥有独立方差等,以寻找对数据解释和预测最优、且复杂度适宜的模型。研究结果表明,最简单的模型1在预测性能与简约性之间达到最佳平衡,而在方法选择上,方法3即洗手后1小时握持塑料管,最适于脱落者分类。作者进一步指出,该方法兼具较强区分能力与较好的自然行为贴近性,因此相较其他方法更具应用潜力。
在技术方法上,研究主要采用以下几个关键策略:其一,招募5名参与者,在4种手部处理/接触条件下对无菌50 mL塑料管或手套内表面进行痕量DNA沉积采样,每种条件重复5次;其二,样本经DNA提取、定量、STR扩增与毛细管电泳检测,并利用STRmix?进行混合样本解释、供者DNA分配及似然比(LR)计算;其三,对沉积者自身DNA量进行log
10转换后,在R v4.3.2中使用rjags实施HBM,比较5类模型并通过留一交叉验证(leave-one-out cross validation, loo)与期望对数预测密度(elpd
loo)评价模型表现;其四,基于模型结果构建脱落倾向总体分布,并讨论其纳入贝叶斯网络(Bayesian Network, BN)进行活动层面评估的可能性。样本队列来源为Flinders University相关参与者,共5人,其中2名女性、3名男性。
在研究结果部分,作者首先给出“3.1. Basic data description”的结果。基础数据描述显示,不同个体之间确有较明显的DNA沉积差异。总体上,person 2在多数方法下均表现为沉积DNA最多的个体,而person 4通常最少。方法层面看,多数方法回收的DNA总量相近,但“15-minute tube”方法整体回收量明显偏低。这一初步观察提示,个体效应和方法效应均可能存在,但不同方法在区分个体时的能力并不一致。
在“3.2. Hierarchical Bayesian modelling results”中,作者系统比较了5种HBM结构。对于“Model 1”,模型假定个体效应与方法效应彼此独立,且共享统一方差结构。后验分布结果显示,person 2与其他个体差异较明显,15分钟塑料管方法与其他方法也有较明显区别。进一步通过后验差值分布比较不同个体、不同方法之间的差异,结果表明person 2与多数个体、以及15分钟塑料管方法与其他方法之间都呈现较强分离。作者还计算了Cohen’s D效应量分布,用以衡量组间差异大小。例如person 2与person 4之间效应量极大,而person 1与person 5之间效应量很小。这说明HBM不仅可判断差异方向,也能通过分布形式评估差异幅度。模型拟合方面,正预测残差分析仅见轻微趋势和少数离群值,尚不足以否定模型。
“Model 2”在模型1基础上加入个体×方法交互项,以检验不同方法是否会改变不同个体之间的相对排序。结果显示,多数交互项分布跨越0,提示交互效应整体不强,缺乏充分证据支持必须纳入此复杂结构。尽管15分钟手套法在个别供者间似乎扩大了分离程度,但作者指出,若不同方法会改变个体排序,则不利于发展统一的脱落者测试,因此这种复杂性并非理想特征。
“Model 3”引入层级结构,使个体效应嵌套于方法效应之下。该结构在理论上适用于样本量较小的情境,因为不同方法内的个体参数可借助总体方法信息获得“收缩”与稳定化估计。结果显示,个体后验分布确实围绕各自方法均值聚集,但与模型2相比并未带来本质不同的相对排序信息,因此额外的层级复杂度缺乏明显收益。
“Model 4”允许不同方法具有独立方差,以检验各方法是否不仅均值不同,而且波动程度不同。结果表明,各方法均值排序与前述模型一致,且方法间方差分布相当接近,提示为不同方法单独设置方差并未提供太多新增解释力。
“Model 5”同时结合层级结构与自由方差,为个体和方法分别设置独立方差。结果显示,与模型4相比,无论方法均值还是方法方差均未发生实质变化;个体方差虽略有分化,但并未转化为更清晰的均值形态差异。总体上,这一最复杂模型并未体现明显优势。
在“Model comparison”部分,作者采用loo比较模型预测性能,并以elpd
loo作为核心指标。结果显示,模型1与模型4的elpd
loo最接近且表现最佳,但考虑到模型1更简洁,因此被确定为首选模型。这一结果说明,在本数据规模下,包含独立个体效应和方法效应的相对简单模型已足够解释主要模式,无需引入更复杂交互、层级或异方差结构。
在“3.3. Building a shedder distribution”中,研究人员进一步展示如何将脱落者状态视为总体连续分布中的一个位置,而非简单的高/中/低类别。作者利用5名供者的个体效应均值构建示意性的脱落倾向分布,并标示各供者在该分布中的相对百分位。结果显示,person 2位于较高脱落区间,person 4接近低脱落边界,person 1、3、5处于中间区间。作者同时指出,由于总体仅包含5人,这一分布尚不足以代表真实总体,但该思路为未来构建人群层面的脱落者连续谱提供了方法论基础。
在“3.4. The requirement for repeated testing”中,作者分析了判定个体脱落倾向所需的重复次数。通过将样本值调整为仅主要受技术重复变异和个体效应影响,并比较1至5次重复时个体百分位分布的稳定性,研究发现重复次数越多,估计越稳定,但不存在绝对清晰的阈值。作者认为约4次重复可达到可接受的置信水平。结果还表明,极高或极低脱落者通常表现较稳定,而中等脱落者更易出现波动;不同方法在稳定性上也有差异,其中手套法与1小时塑料管法总体波动较低,而15分钟塑料管法对若干个体表现出较高变异。
讨论部分首先聚焦“4.1. Method choice”。作者指出,设计脱落者测试必须先明确目标:是希望模拟犯罪现场接触时实际沉积的DNA量,还是希望尽可能准确地确定个体在人群脱落倾向分布中的位置。前者更贴近具体案件接触事件,但受表面类型、接触时长、压力等因素影响较大;后者更具有一般化潜力,但需要更复杂的模型才能将脱落倾向与具体DNA量联系起来。由于目前尚不清楚决定脱落倾向的主导因素究竟是生物学特征、行为习惯还是环境暴露,因此方法选择需要兼顾标准化与自然性。研究认为,手套法虽然在某些情形下具有较好区分度,但佩戴手套可能改变出汗状态,从而偏离自然沉积过程;相比之下,洗手后恢复正常活动1小时再进行沉积,更接近真实行为,同时又保留了基本标准化条件,因此方法3更值得优先采用。作者也提到,未来不排除组合多种方法联合评估的可能,但本研究未对这一策略进行实证考察。
在“4.2. Using shedder assignment in evaluation”中,作者讨论了脱落者信息如何纳入法医证据解释框架。研究提出,如果能够确定某人在总体脱落倾向分布中的百分位,并且能够建立该百分位与预期DNA沉积量之间的关系,那么这一信息便可作为修正项并入活动层面评估模型,例如贝叶斯网络。文中以示例性BN展示:不同脱落百分位可映射为log
10尺度上的DNA量增减,并据此调整特定接触事件下平均个体的预期DNA沉积量。作者同时强调,本文实际测量的是DNA转移、持续与回收的综合结果,而不仅是单纯转移,因此若将脱落者测试进一步用于定量解释,仍需通过额外校准实验区分转移效应与回收效应,并考虑实验室间回收差异。
研究结论部分可译为:基于本研究,在所考察的4种方法中,最适合用于界定脱落倾向的方法是方法3,即洗手后1小时进行DNA沉积。研究人员采用了两项策略以推进脱落者测试的发展:第一,将脱落者判定视为个体位于总体脱落者连续谱上的某一点;第二,采用分层贝叶斯建模(HBM)确定最适合分析多种方法所得数据的统计模型,并据此最终选择最佳方法。对于此类样本量有限的研究,HBM相较频率学方法具有优势,因为其处理数据的方式更适合小样本与复杂结构。研究进一步表明,使用1小时塑料管握持法判定脱落者状态时,约4次重复可提供可接受的判定置信度。作者还示范了如何将个体位于脱落者连续谱中的位置信息纳入法医观察结果评估。尽管如此,目前数据量仍不足以在证据评估中稳健建模脱落者状态;未来仍需开展更大规模的人群研究,以建立稳定的总体分布,并阐明不同脱落百分位在不同转移情境下对DNA转移量的影响。具备这两类信息后,才能更有效地将特定关注个体(POI)的脱落倾向纳入DNA数量相关的法医评估之中,从而增强不同命题之间的区分能力。