《Supportive Care in Cancer》:Mean differences or standardized mean differences in network meta-analyses
编辑推荐:
本通讯针对一项已发表的关于针灸与按压治疗癌痛的网状荟萃分析,就其中使用的效应量指标——标准化平均差(SMD)的异常取值(如-3.08)提出了专业质询。研究者认为,报告中过大的SMD值更可能源于误用了原始的平均差(MD),而非真实的SMD,这直接关系到分析结果的准确性。此文对提升支持性肿瘤护理领域荟萃分析的方法学严谨性具有重要意义。
在医学研究的海洋中,系统综述和荟萃分析被视为循证医学的“灯塔”,它们汇总多项研究结果,旨在为临床实践提供最可靠的证据。特别是在肿瘤支持治疗领域,如何有效管理癌症相关疼痛,提升患者生活质量,一直是医护人员和研究者关注的焦点。近年来,针灸、按压等非药物疗法在该领域展现了潜力,相关的临床研究也如雨后春笋般涌现。为了从这些纷繁复杂的研究中提炼出最具价值的结论,一种更为高级的统计方法——网络荟萃分析(Network Meta-Analysis, NMA)被广泛应用。它不仅能比较多种干预措施与对照的差异,还能对“未曾头对头比较”过的不同干预措施进行间接比较,从而对一系列疗法的疗效进行排序。
然而,方法越是强大,对其实施的严谨性要求就越高。近期,在肿瘤支持护理领域的一本重要期刊《Supportive Care in Cancer》上,发表了一篇由Wei等人(2025)完成的系统综述和网络荟萃分析,评估了针灸与按压治疗癌症相关疼痛的疗效。该研究汇集了37项随机试验,涉及3066名患者,得出结论认为耳针、耳穴按压和穴位按摩对癌痛有效,并报告了相应的标准化平均差(Standardized Mean Difference, SMD)。这听起来是一项令人鼓舞的研究,但细看之下,其报告中呈现的效应量数值却引发了专业学者的警觉:耳针的SMD竟高达-3.08,耳穴按压和穴位按摩的SMD也达到-1.64。在通常认为SMD绝对值0.8即属“大效应”的医学研究领域,尤其是效应量通常较为温和的支持性肿瘤学研究中,出现如此巨大的数值,如同在平静的湖面投下巨石,激起了对数据真实性与分析可靠性的深切疑虑。这究竟是疗法效果真的如此惊人,还是分析过程中存在某种“误读”?为了探究这个问题,一封致编辑的信件对这项研究的方法学细节展开了深入剖析。
研究人员主要采用了文献评述与统计逻辑推演的方法。其核心是对已发表的网络荟萃分析论文(Wei et al., 2025)中的数据进行批判性审视,重点分析其效应量计算与报告的合理性。研究基于公开的论文内容,特别是其中报告的效应量数值、使用的评估工具(如NRS, VAS, BPI)以及肿瘤支持治疗领域通常观察到的效应量范围,进行逻辑比对和推断。
背景与问题提出
该通讯开篇即指出,Wei等人的研究在比较不同针灸和按压疗法时使用了标准化平均差(SMD)作为效应量。由于原始研究使用了多种疼痛评估量表,如数字评定量表(NRS)、视觉模拟量表(VAS)和简明疼痛量表(BPI),这些量表的量程不同,因此将原始平均差(MD)转化为SMD以进行合并分析是网络荟萃分析的标准做法。
对报告SMD值的质疑
然而,通讯作者认为报告中给出的SMD值(-3.08, -1.64等)值得仔细审视。按照科恩(Cohen's d)的常规解释,0.2、0.5和0.8通常分别被视为小、中、大效应量。一个超过-3.0的效应量意味着治疗组的平均值比对照组低三个标准差以上。在疼痛、恶心、疲劳等结局通常只表现出中等或较小效应量的支持性肿瘤学研究中,如此巨大的效应量是高度不可能的。
对数值来源的推断
更合理的解释是,这些报告的值更像是原始的平均差(MD),而非真实的标准化平均差(SMD)。例如,在一个11分制的NRS量表上,-3.08的MD是一个合理的数值。如果疼痛评分的典型标准差在1.5到3.0之间,那么对应的SMD将更接近-1.0或更小,而不是-3.08。由于原始研究使用了多种结局量表,除非所有研究都使用完全相同的测量工具(事实并非如此),否则MD不能直接合并。因此,通讯推断作者很可能错误地将未标准化的MD标注为了SMD。
研究结论与意义
总结来说,尽管原文献作者将报告值标记为SMD,但其量级与支持性肿瘤学试验中典型的效应量分布不一致。这些数值更接近于未标准化的平均差,这引起了人们对效应大小计算准确性以及随之而来的网络荟萃分析结果有效性的担忧。这项通讯的意义在于,它强调了在实施和报告高级统计方法如网络荟萃分析时,方法学严谨性的至关重要性。特别是在比较使用不同测量工具的研究时,正确计算和解释效应量是确保证据可靠性的基石。任何对效应量的误用或误报,都可能导致对干预措施疗效的严重高估或误导性结论,进而影响临床决策。因此,它呼吁研究者、期刊编辑和读者在评估此类证据时,需对报告中效应量的合理性保持审慎的批判性思维。