GRADE指南42:在决策过程中使用阈值来评估健康效益与危害(GRADE指南42)

《Annals of Internal Medicine》:GRADE Guidance 42: Using Thresholds for Judgments on Health Benefits and Harms in Decision Making (GRADE Guidance 42)

【字体: 时间:2025年10月08日 来源:Annals of Internal Medicine

编辑推荐:

  本文提出 GRADE 指南中决策阈值(DTs)的两种主要应用方法:基于实证研究通用系数确定 DTs,或通过专家调查直接设定。方法结合了定量效用值与定性专家意见,旨在提升指南制定中的透明度与一致性,并辅以在线计算工具及附录案例。

  在医学和健康政策领域,评估干预措施对健康结果的影响是制定指南和进行健康技术评估的核心任务之一。然而,这种评估往往依赖于决策者对效应大小的主观判断,而这可能导致结果缺乏一致性与透明度。为此,GRADE(Grading of Recommendations Assessment, Development and Evaluation)系统提出了一种新的方法,即使用决策阈值(Decision Thresholds, DTs)来帮助决策者更系统、更明确地判断干预措施的效果是否具有临床意义。本文详细介绍了这一方法的理论基础、实施方式以及其在实际应用中的价值。

### 决策阈值的意义与作用

在临床实践中,干预措施的效果通常以风险差异(Risk Difference, RD)等形式呈现。例如,一个干预可能带来每年10%的死亡率下降,也可能导致每年10%的轻微皮疹发生率上升。这种情况下,决策者需要权衡干预的益处与潜在的伤害。然而,对于同样的数值(如10%),其意义可能因健康结果的重要性而有所不同。如果某项干预能显著降低一种致命疾病的发生率,那么10%的改善可能被认为是重大成果;但如果该干预只是轻微减轻某种非致命症状,则同样的数值可能被视为微不足道。因此,明确的决策阈值可以帮助决策者在不同情境下更一致地评估效应大小,并确保他们的判断具有透明性和可解释性。

决策阈值的作用主要体现在三个方面。首先,它们为不同健康结果的效应大小提供了一个参考标准,使决策者能够基于统一的尺度进行比较。其次,它们有助于提高判断的一致性,避免因个体差异或经验不同而导致的主观偏差。最后,它们使得决策过程更加结构化,便于读者理解并评估推荐依据。通过这种方式,决策阈值不仅提升了决策的科学性,还增强了指南和评估报告的可信度。

### 决策阈值的两种主要方法

为了实现上述目标,本文提出了两种主要方法来确定和使用决策阈值。第一种方法基于之前发表的一项方法学研究中得出的通用系数(Generic Coefficients)。这些系数是通过对利益相关者的调研得出的,包括临床医生、患者代表、公众成员、政策制定者和研究者等。在这些调研中,参与者被要求对不同健康结果的效应大小进行判断,从而得出适用于多种健康结果的通用系数。

第二种方法则是通过直接询问专家或决策小组(Guideline Development Groups, GDGs)来确定特定健康结果的决策阈值。这种方法允许决策者根据自己的专业知识和经验,设定更符合实际需求的阈值。尽管这两种方法各有优势,但它们可以结合使用,以检查阈值的一致性并增强决策过程的严谨性。

在第一种方法中,通用系数被用于计算特定健康结果的决策阈值。例如,如果某项干预导致每年每1000人中有10例死亡减少,那么根据通用系数和该健康结果的效用值(Utility Value),可以判断这一效应是否属于“小”、“中等”或“大”范畴。效用值通常在0到1之间,1代表完全健康,0代表死亡。通过将通用系数与效用值结合,可以为每项健康结果设定一个具体的决策阈值,从而更精确地评估干预的实际影响。

在第二种方法中,决策者或专家直接对特定健康结果的效应大小进行判断。这种方法可以避免对通用系数的依赖,但也可能因个体差异而导致阈值的不一致。因此,结合两种方法可以提高决策的客观性和可靠性。例如,在制定指南时,决策者可以先使用通用系数设定初步的决策阈值,然后通过专家意见进行调整,以确保这些阈值符合实际需求。

### 决策阈值的实际应用与案例分析

为了验证这两种方法的有效性,研究者们在实际的指南制定过程中进行了试点应用。例如,在多发性硬化症的网络荟萃分析、新冠血栓形成预防药物的成对比较以及多药耐药性肺结核的新药物方案评估中,决策者们使用了基于通用系数的决策阈值。这些案例表明,使用决策阈值可以显著提高判断的一致性和透明度,同时减少因主观差异带来的不确定性。

在另一项试点中,决策小组通过问卷调查和共识讨论直接设定了特定健康结果的决策阈值。这种方法允许决策者根据自己的经验和专业知识,对效应大小进行更具体的判断。然而,这种方法也可能存在局限性,例如问卷调查的主观性较强,或者不同专家之间意见不一致,从而影响决策的客观性。因此,研究者建议在使用这种方法时,应结合其他数据来源,如文献综述中的效用值,以提高判断的准确性。

### 决策阈值的不确定性与应对策略

在使用决策阈值时,还需要考虑多个来源的不确定性。这些不确定性包括干预效应的绝对风险差异、健康结果的效用值以及数据来源的可靠性。为了应对这些不确定性,研究者建议将这些参数视为概率分布,并通过模型化的方式进行分析。然而,在实际应用中,决策者通常需要确定一个具体的数值,以便进行最终判断。因此,本文提供了实用的指导,帮助决策者在面对不确定性时,如何选择合适的阈值并进行合理的解释。

此外,决策阈值的使用还需要考虑到不同健康结果之间的相关性。例如,静脉血栓栓塞症(Venous Thromboembolism, VTE)和死亡率之间可能存在高度相关性,因此简单地将这些结果的效应相加可能并不合适。在这种情况下,决策者可以采取几种策略,如选择最可靠的健康结果作为主要参考,或者对相关结果进行调整,以确保最终的判断更加准确和全面。

### 决策阈值对指南制定的促进作用

决策阈值的引入不仅有助于提高判断的一致性和透明度,还能促进指南制定的效率。在实际操作中,决策者往往需要回顾以往的判断,以确保当前的决策与之前的推荐保持一致。如果没有明确的决策阈值作为参考,这种回顾过程可能变得繁琐且容易受到主观偏差的影响。因此,使用决策阈值可以简化这一过程,使决策者能够更快地做出判断,同时减少不必要的重复工作。

对于动态更新的指南(Living Guidelines),决策阈值的作用尤为重要。在这些指南中,新的证据不断涌现,决策者需要在不同时间点重新评估干预的效果。通过预先设定的决策阈值,他们可以在新证据出现时迅速做出判断,从而保持指南的一致性和时效性。此外,决策阈值还可以用于评估其他GRADE领域,如偏倚风险和不一致性,为更全面的指南制定提供支持。

### 决策阈值的局限性与未来发展方向

尽管决策阈值为评估干预效果提供了重要的工具,但其应用仍存在一定的局限性。首先,通用系数的代表性可能受到样本选择的影响。例如,某些健康结果可能在特定人群中具有更高的重要性,而在其他人群中则相对较低。因此,通用系数可能无法完全适用于所有情况,需要根据具体情况进行调整。

其次,效用值的获取可能存在挑战。虽然文献中已经有一些效用值的研究,但这些值往往基于不同的定义和时间框架,可能与当前指南中所关注的健康结果不完全一致。因此,研究者建议在实际应用中,优先使用决策小组或利益相关者的直接反馈,以确保效用值的准确性和相关性。

此外,专家意见的收集和分析也面临一定的方法学挑战。如何确保问卷调查的结果具有代表性,如何处理不同专家之间的意见分歧,都是需要进一步研究的问题。未来的研究可以集中在这些方面,以改进决策阈值的设定方法,并增强其在不同情境下的适用性。

### 决策阈值的整合与推广

本文提出的决策阈值方法不仅适用于特定的健康结果,还可以推广到更广泛的医学领域。通过明确的阈值设定,决策者能够在不同干预措施之间进行比较,从而做出更科学的推荐。此外,决策阈值的使用还可以促进不同指南之间的协调,确保在不同背景下,决策过程保持一致性和透明度。

在实际应用中,决策阈值的设定需要结合多种方法,包括文献综述、专家意见和利益相关者的反馈。这种方法不仅提高了决策的科学性,还增强了指南的可信度和可解释性。通过这种方式,决策者能够在复杂的医学背景下,更准确地评估干预措施的效果,并做出符合患者需求和公共健康目标的推荐。

总之,决策阈值的引入为医学和健康政策领域的决策过程提供了一个新的视角。通过使用这些阈值,决策者能够在不同健康结果之间进行更系统的比较,确保他们的判断具有透明性和一致性。尽管存在一定的局限性,但随着进一步的研究和实践,决策阈值有望成为未来指南制定和健康技术评估的重要工具。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号