同一主题系统评价的方法学质量堪忧：一项揭示重叠研究与标准缺失的研究学调查

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Clinical Epidemiology》：Systematic reviews on the same topic are common but often fail to meet key methodological standards: a research-on-research study

【字体：大中小】 时间：2025年10月19日 来源：Journal of Clinical Epidemiology 5.2

编辑推荐：

　　本研究针对同一主题系统性评价(SR)重叠普遍但方法学标准依从性低的问题，对2022年发表的107篇SR进行抽样，并检索2018-2023年间相关SR，评估其方法学质量(包括协议注册、数据库检索等6项标准)。结果显示31.4%的SR存在重叠，仅6.5%满足全部方法学标准，21.2%的重叠SR结论存在分歧，凸显当前SR方法学规范执行的严峻挑战。

在当今信息爆炸的时代，医学研究者们常常面临这样的困境：针对同一个临床问题，竟然可以找到多篇系统评价(Systematic Review, SR)文章。这些本应提供最可靠证据的研究，却时常出现结论不一、方法各异的混乱局面。这种"重复评价"现象不仅浪费了宝贵的科研资源，更让临床医生和决策者陷入无所适从的尴尬境地。

正是在这样的背景下，由Wilfred Kwok、Titiane Dallant、Guillaume Martin等研究者组成的团队开展了一项别开生面的"研究之研究"(research-on-research)。这项发表在《Journal of Clinical Epidemiology》上的研究，如同一面镜子，让我们得以清晰地审视系统评价领域的现状与问题。研究人员试图回答三个核心问题：同一主题的系统评价重叠现象到底有多普遍？这些评价是否遵循了关键的方法学标准？重叠的评价是否存在结论分歧？

为了客观地回答这些问题，研究团队设计了一套严谨的调查方案。他们首先从2022年发表的系统评价中随机抽取了107篇包含Meta分析(MA)的研究作为样本，从中提取出105个不同的研究问题。然后，针对每个问题，系统检索了2018年至2023年间发表的所有相关系统评价（包含Meta分析），最终共纳入230篇系统评价进行分析。评估的关键方法学标准包括六项基本要求：研究方案注册、检索主要电子数据库、检索试验注册库、双人独立筛选和提取数据、使用Cochrane偏倚风险(Risk-of-Bias)工具以及进行GRADE(Grading of Recommendations Assessment, Development and Evaluation)证据质量评估。

研究结果揭示了系统评价领域的严峻现实。在105个研究问题中，有33个问题（31.4%，95%置信区间[CI]：22.9-41.3）存在重叠的系统评价，每个问题的重叠评价数量中位数为3篇（四分位距[IQR]为2-6，范围2-19）。这意味着近三分之一的临床问题都被多个研究团队"重复评价"过。

更令人担忧的是方法学质量的普遍不足。在230篇系统评价中，仅有15篇（6.5%）完全满足了六项关键方法学标准。相应地，在105个研究问题中，只有12个问题（11.4%）至少有一篇系统评价达到了这一基本质量标准。这一发现表明，绝大多数系统评价在方法学严谨性方面存在明显缺陷。

最为关键的是，在33个存在重叠评价的研究问题中，有7个问题（21.2%）的不同系统评价得出了相互矛盾的结论。这种结论分歧不仅反映了方法学质量的参差不齐，也可能对临床实践产生误导。

在方法学层面，本研究采用了几个关键技术：随机抽样法确保样本代表性；系统检索策略保证文献查全率；预定义的方法学质量评估标准（包括协议注册、多数据库检索等6项核心指标）；重叠度量化方法（如计算重叠SR数量和频次）；统计分析方法（包括百分比计算和95%置信区间估计）。这些方法的综合运用保证了研究结果的科学性和可靠性。

结果

重叠系统评价的频率

研究发现系统评价重叠现象相当普遍。从2022年发表的系统评价中提取的105个研究问题中，有33个（31.4%）存在重叠评价，即针对同一临床问题有多个系统评价同时存在。每个问题的重叠评价数量中位数为3篇，最多的问题甚至有多达19篇系统评价。

方法学标准的符合情况

方法学质量评估结果令人担忧。在全部230篇系统评价中，仅有6.5%的研究完全满足了六项关键方法学标准。各项标准的符合率也存在较大差异，反映出当前系统评价在方法学严谨性方面的普遍不足。

结果的一致性分析

在存在重叠评价的33个问题中，有超过五分之一（21.2%）的不同系统评价得出了不一致的结论。这种结论分歧凸显了方法学质量差异可能对证据可靠性产生的实质性影响。

本研究通过大规模调查揭示了系统评价领域存在的三个关键问题：普遍的重叠评价现象、普遍的方法学标准缺失、以及由此导致的结论不一致风险。这些发现不仅证实了业内长期存在的担忧，更为改进系统评价的质量控制提供了实证依据。

研究的深层意义在于指出了当前循证医学实践中的一个系统性缺陷：虽然系统评价被视为最高级别的证据，但其生产过程却缺乏足够的质量保证。这种情况不仅造成了科研资源的浪费，更可能通过提供矛盾或低质量的证据而误导临床决策。

研究者建议，未来应当加强系统评价的规范化管理，包括强化研究方案注册、推广标准化的方法学报告、以及建立避免重复评价的机制。只有通过这些措施，才能确保系统评价真正发挥其作为"证据之王"的应有价值，为临床实践提供可靠、一致的决策依据。

这项研究的意义超越了系统评价本身，它提醒整个科研界：在追求证据数量的同时，更应关注证据生产的质量。只有当每一篇系统评价都遵循严格的方法学标准时，循证医学才能真正实现其科学、客观、可靠的初衷。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号