
-
生物通官微
陪你抓住生命科技
跳动的脉搏
PRECIS-2工具在随机对照试验设计中的回顾性应用评估:一项多中心实证研究
【字体: 大 中 小 】 时间:2025年09月06日 来源:Journal of Clinical Epidemiology 5.2
编辑推荐:
【编辑推荐】为解决PRECIS-2工具在回顾性评估临床试验"实用性-解释性"特征时缺乏可靠性数据的问题,Andrew Willis团队对30项引用PRECIS-2的RCT开展多维度分析,发现试验设计普遍偏向实用性特征,但评估者间一致性较低(κ值0.32-0.33)。该研究为改进PRECIS-2作为回顾性评估工具提供了重要循证依据。
在临床试验方法学领域,如何平衡试验设计的"解释性"(explanatory)与"实用性"(pragmatic)特征始终是个核心难题。2009年诞生的PRECIS(Pragmatic-Explanatory Continuum Indicator Summary)工具及其升级版PRECIS-2,通过9个关键维度帮助研究者直观呈现试验设计在"解释-实用"连续谱上的定位。这个"轮状"评估工具本是为前瞻性试验设计而生,但近年来却被越来越多地用于回顾性评估已发表试验的"实用主义"程度——这种"事后诸葛亮"式的应用是否可靠?这正是由Andrew Willis领衔的国际研究团队在《Journal of Clinical Epidemiology》发表的研究要回答的关键问题。
研究团队采用实证研究方法,从引用PRECIS-2工具的文献中随机抽取30项随机对照试验(RCT)作为分析样本。创新性地组建两个独立评审组,每组均由临床专家与方法学家配对,通过标准化培训后分别进行盲法评分。采用κ统计量定量评估组内评分者间一致性,并比较组间共识评分差异。为提升实用性,团队还探索了放宽评分差异容忍度(1分差异内视为一致)对可靠性的影响。
主要技术方法包括:1)系统抽样获取30项引用PRECIS-2的RCT;2)组建临床-方法学混合评审组进行独立评分;3)采用PRECIS-2的9维度评分体系(含灵活性、随访强度等);4)κ统计量评估评分者间信度;5)敏感性分析考察评分标准调整效果。
【结果】
◆ 设计特征分布:分析显示引用PRECIS-2的RCT普遍具有实用性设计倾向,在9个评估维度中均呈现向"实用端"偏移的特征。
◆ 评分者间一致性:组内评审者间信度整体较低,最高值出现在"分析"(κ=0.32)和"随访"(κ=0.33)维度,其余维度κ值均低于0.3。
◆ 共识评分比较:两组共识评分间一致性未显著优于组内一致性,提示增加评审人数未必能提升评估可靠性。
◆ 评分标准优化:当将"一致"标准放宽至1分差异内时,8个维度的符合率超70%,但"组织"维度未见改善。
【讨论与结论】
这项跨国合作研究揭示了PRECIS-2工具在回顾性应用时面临的方法学挑战。尽管被评估试验普遍展现出实用性设计特征,但低κ值表明现有评分体系在回顾性评估中的可靠性存疑。值得注意的是,放宽评分差异标准显著提升了符合率,这提示可能需要重构5分量表的解读方式。研究结果对三类人群具有直接指导价值:对系统评价作者,建议谨慎解读PRECIS-2回顾性评分结果;对工具开发者,需要完善评分指南并考虑简化量表;对期刊编辑,可参考该研究建立更科学的试验设计特征报告规范。该研究首次为PRECIS-2的回顾性应用提供了可靠性证据,为后续方法学改进奠定了实证基础。
生物通微信公众号
知名企业招聘