《Scandinavian Journal of Trauma, Resuscitation and Emergency Medicine》:An inter-rater reliability study of a modified version of SATS as a prehospital triage tool
编辑推荐:
背景:分诊系统在将患者分配至适当照护水平中起着关键作用。全球使用多种分诊系统,所有系统都需要对其信度和效度进行科学评估。关于院前分诊系统的证据仍然有限。南非分诊量表(South African Triage Scale, SATS)已在多个地区经当地改编后使用
背景:分诊系统在将患者分配至适当照护水平中起着关键作用。全球使用多种分诊系统,所有系统都需要对其信度和效度进行科学评估。关于院前分诊系统的证据仍然有限。南非分诊量表(South African Triage Scale, SATS)已在多个地区经当地改编后使用,但修改版本需要独立评估。本研究旨在检验修改版SATS分诊系统在瑞典某地区急诊医疗服务(emergency medical services, EMS)中应用时的信度。研究还探讨了具有不同经验和能力水平的注册护士(registered nurses, RNs)的分诊表现是否存在差异。方法:这项前瞻性横断面评估者间信度研究纳入了34名在区域EMS工作的RNs。参与者通过数字问卷独立对30个院前病例小场景(case vignettes)进行分诊,共产生1,010次分诊评估。使用描述性数据分析。评估者间信度通过Krippendorff’s alpha(α)和百分比一致性进行评估。采用混合效应逻辑回归分析分诊分配与RN特征(包括性别、经验年限和专科教育)之间的关联。结果:本研究表明,在院前环境中使用修改版SATS时,评估者间一致性不足。Krippendorff’s α为0.60,提示当分诊等级作为有序数据处理时一致性较差。三个病例小场景达到完全一致,其余病例的一致性范围为32%至94%。在30个小场景中,有25个出现了手动向上分诊(manual up-triage),频率范围为6%至74%。未发现分配的分诊等级与性别、EMS经验年限或专科教育之间存在关联。结论:该修改版SATS在院前环境中应用时显示出较低的评估者间信度。在不同患者场景中,一致性差异显著,尤其是在以非特异性症状和接近正常生命体征为特征的病例中。这些发现强调了系统评估修改版分诊系统的重要性,以支持院前护理中一致的决策制定和患者安全。
**论文解读文章**
**研究背景**
院前分诊系统在急诊医疗服务(emergency medical services, EMS)中用于决定患者转运速度、医院目的地选择以及病情紧急程度,以区分急性和非急性患者。尽管全球存在多种分诊系统,但其可靠性和效度需经过科学评估。目前,院前分诊系统的证据仍有限,多数研究集中于创伤患者,而非创伤患者的研究需求迫切。南非分诊量表(South African Triage Scale, SATS)最初为南非院前和急诊环境开发,后经本地化改编用于多个地区,但修改版本需独立评价。瑞典某地区使用的修改版SATS自2018年引入后,虽经多学科专家基于SATS挪威版调整,但尚未经过科学验证。现有研究仅有一项评估了原始SATS在院前环境中的信度,且该研究在低收入国家进行,与本研究的背景差异较大。因此,该研究旨在检验修改版SATS在瑞典某区域EMS中应用时的评估者间信度,并探讨注册护士(registered nurses, RNs)的不同经验和能力水平是否影响分诊表现。该论文发表在《Scandinavian Journal of Trauma, Resuscitation and Emergency Medicine》。
**主要关键技术方法**
研究者采用前瞻性横断面评估者间信度(inter-rater reliability, IRR)研究设计,基于30个虚构的院前病例小场景(case vignettes)进行。研究区域为瑞典中部某地区,覆盖约28.6万居民,面积18,000 km2,共有约250名EMS员工,其中223名临床活跃RNs被邀请参与,最终34名RNs完成研究。参与者通过数字问卷独立分诊每个小场景,共产生1,010个有效评估。信度评估采用Krippendorff’s alpha(α)和百分比一致性统计,并利用混合效应逻辑回归模型分析RN特征(性别、EMS经验年限、专科教育)与分诊等级之间的关联。数据收集于2025年秋季,为期八周。
**研究结果**
**评估者间分诊一致性**
Krippendorff’s α在包含手动向上分诊(manual up-triage)的总分诊中为0.602(95% CI [0.423, 0.712]),提示一致性较差。排除手动向上分诊后,α为0.621。当分诊等级二分为高紧急(橙色/红色)与低紧急(绿色/黄色)时,α降至0.47。9个小场景被分配至所有四个分诊等级,13个小场景覆盖三个等级。百分比一致性在三个小场景中达到100%,而三个小场景一致性低于50%(低于50%一致性出现在场景2、4、14)。
**创伤与活动度评估的差异**
创伤因子仅在少数小场景中被标记,但若出现,多数评估者一致应用(如场景4、5、15、17、18中100%标记)。活动度评估在不同小场景间变异显著:部分场景几乎统一评定为“独立”,另一些则多为“担架/无法移动”;部分场景(如8、17、21、26)在三个活动度类别中分布广泛,提示评估者判断存在实质性差异。活动度评估的变异导致四个小场景(8、13、19、23)在高低紧急分界阈值上出现差异,其中场景19的分歧最为突出(高紧急与低紧急分类比例接近)。
**手动向上分诊的差异**
在30个小场景中,手动向上分诊发生频率从0%到72.7%不等。场景4(67.6%)、14(47%)、16(35.3%)、26(58.8%)和29(72.7%)频繁偏离算法。总计1,010次评估中,199次(19.7%)出现手动向上分诊,其中68.8%发生在初始绿色分诊等级,21.1%为黄色,10.1%为橙色。多数向上分诊为提升一个等级(如绿至黄、黄至橙、橙至红)。
**分诊器赋值的影响**
四个小场景(2、7、14、25)在低紧急与高紧急阈值上呈现近乎均匀的分布。进一步分析显示,变异主要源于分诊器(discriminator)赋值后的分歧,手动向上分诊也贡献了最终分诊等级的差异。
**RN特征与分诊结果的关联**
混合效应逻辑回归模型显示,RN的EMS经验年限(OR=1.01, 95% CI 0.98–1.05, p=0.426)、专科教育(如救护专科护士 vs. 注册护士:OR=1.24, 95% CI 0.65–2.36, p=0.506)和性别(OR=1.03, 95% CI 0.58–1.82, p=0.917)均与分配高紧急分诊等级无显著关联。
**讨论与结论**
讨论部分指出,本研究发现的Krippendorff’s α为0.60,低于其他使用相同统计量的分诊系统信度研究(0.68–0.78),且二分类后信度进一步降低(α=0.47),表明在区分需紧急与无需紧急护理的患者时存在显著分歧。一致性高度依赖病例特征:明确生理异常或清晰高紧急场景一致性高,而非特异性症状、接近正常生命体征的场景则依赖临床判断,导致低一致性。手动向上分诊的频繁使用反映了算法未能充分捕捉患者风险时,评估者依赖临床判断的补偿行为,这虽在院前环境中必要,但也是信度降低的关键因素。研究未发现经验、教育或性别与分诊等级相关,提示个体背景特征不能解释变异,可能需关注培训类型或决策过程差异。
结论部分翻译如下:
在本项院前评估者间信度研究中,一项本地修改版SATS在注册护士中显示出中等至较低的一致性。不同患者病例间一致性变异显著,尤其是在呈现接近正常生命体征的病例中。临床经验或专科教育与分诊模式均无关联。这些发现强调了在院前急救护理中谨慎实施并持续评估修改版分诊系统的必要性。