PRECIS-2工具在随机对照试验设计中的回顾性应用评估：一项多中心实证研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年09月06日 来源：Journal of Clinical Epidemiology 5.2

编辑推荐：

　　【编辑推荐】为解决PRECIS-2工具在回顾性评估临床试验"实用性-解释性"特征时缺乏可靠性数据的问题，Andrew Willis团队对30项引用PRECIS-2的RCT开展多维度分析，发现试验设计普遍偏向实用性特征，但评估者间一致性较低（κ值0.32-0.33）。该研究为改进PRECIS-2作为回顾性评估工具提供了重要循证依据。

在临床试验方法学领域，如何平衡试验设计的"解释性"（explanatory）与"实用性"（pragmatic）特征始终是个核心难题。2009年诞生的PRECIS（Pragmatic-Explanatory Continuum Indicator Summary）工具及其升级版PRECIS-2，通过9个关键维度帮助研究者直观呈现试验设计在"解释-实用"连续谱上的定位。这个"轮状"评估工具本是为前瞻性试验设计而生，但近年来却被越来越多地用于回顾性评估已发表试验的"实用主义"程度——这种"事后诸葛亮"式的应用是否可靠？这正是由Andrew Willis领衔的国际研究团队在《Journal of Clinical Epidemiology》发表的研究要回答的关键问题。

研究团队采用实证研究方法，从引用PRECIS-2工具的文献中随机抽取30项随机对照试验（RCT）作为分析样本。创新性地组建两个独立评审组，每组均由临床专家与方法学家配对，通过标准化培训后分别进行盲法评分。采用κ统计量定量评估组内评分者间一致性，并比较组间共识评分差异。为提升实用性，团队还探索了放宽评分差异容忍度（1分差异内视为一致）对可靠性的影响。

主要技术方法包括：1）系统抽样获取30项引用PRECIS-2的RCT；2）组建临床-方法学混合评审组进行独立评分；3）采用PRECIS-2的9维度评分体系（含灵活性、随访强度等）；4）κ统计量评估评分者间信度；5）敏感性分析考察评分标准调整效果。

【结果】

◆ 设计特征分布：分析显示引用PRECIS-2的RCT普遍具有实用性设计倾向，在9个评估维度中均呈现向"实用端"偏移的特征。

◆ 评分者间一致性：组内评审者间信度整体较低，最高值出现在"分析"（κ=0.32）和"随访"（κ=0.33）维度，其余维度κ值均低于0.3。

◆ 共识评分比较：两组共识评分间一致性未显著优于组内一致性，提示增加评审人数未必能提升评估可靠性。

◆ 评分标准优化：当将"一致"标准放宽至1分差异内时，8个维度的符合率超70%，但"组织"维度未见改善。

【讨论与结论】

这项跨国合作研究揭示了PRECIS-2工具在回顾性应用时面临的方法学挑战。尽管被评估试验普遍展现出实用性设计特征，但低κ值表明现有评分体系在回顾性评估中的可靠性存疑。值得注意的是，放宽评分差异标准显著提升了符合率，这提示可能需要重构5分量表的解读方式。研究结果对三类人群具有直接指导价值：对系统评价作者，建议谨慎解读PRECIS-2回顾性评分结果；对工具开发者，需要完善评分指南并考虑简化量表；对期刊编辑，可参考该研究建立更科学的试验设计特征报告规范。该研究首次为PRECIS-2的回顾性应用提供了可靠性证据，为后续方法学改进奠定了实证基础。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号