编辑推荐:
研究评估 OPUF 评估 EQ-HWB-S 的重测信度,发现其总体可靠但个体层面有差异,为后续研究奠基。
在健康经济学领域,准确评估健康相关生活质量的效用值至关重要。EQ 健康与幸福简表(EQ-HWB-S)作为一种新型的 9 项测量工具,旨在生成效用值,用于健康和社会护理干预措施的经济评估。然而,其包含九个维度和五个响应水平,共描述了 1,953,125 种健康状态,传统的偏好引出技术,如时间权衡(TTO)和离散选择实验(DCE),在应用于 EQ-HWB-S 时面临挑战。这些方法不仅需要大样本量,而且会给参与者带来认知负担,尤其是在同时考虑九个维度时。因此,寻找一种更有效的方法来评估 EQ-HWB-S 的效用值迫在眉睫。
为了解决这些问题,来自谢菲尔德大学健康与相关研究中心、比勒费尔德大学等机构的研究人员开展了一项关于个人效用函数在线引出法(OPUF)评估 EQ-HWB-S 重测信度的研究。该研究成果发表在《The European Journal of Health Economics》上,为健康价值评估提供了新的视角。
研究人员采用了多种关键技术方法。首先,通过在线面板招募了 220 名德国参与者,包括 73 名普通人群和 147 名糖尿病或风湿性疾病患者。其次,使用 OPUF 调查对参与者进行两次评估,间隔两周。在调查过程中,采用了三步估值法,分别获取维度的摆动权重、中间水平权重和锚定因子,以此来推导效用递减值。最后,运用组内相关系数(ICC)、Spearman 相关系数、t 检验等统计方法,在个体和总体层面评估重测信度。
研究结果如下:
- 样本特征:在 330 名初始参与者和 257 名重测参与者中,最终分析样本为 220 名。普通人群样本中多数参与者年龄大于 50 岁,患者样本年龄更大,且两个样本的教育水平分布有所不同,性别分布较为均衡12。
- 维度排名和摆动权重:总体样本中,只有 42.27% 的参与者在两次测试中选择了相同的最高排名维度,个体层面维度排名的一致性也较低。在摆动权重方面,总体样本中五个维度的个体层面 ICC 被归类为一致性差,四个维度为中等。患者样本的一致性明显低于普通人群样本34。
- 水平评级:在总人群样本中,测试和重测分别有 20.45% 和 20.90% 的参与者产生不合逻辑的响应并被排除。ICC 值显示,70.37% 的水平评级一致性差,29.63% 为中等。患者样本的可靠性比普通人群样本更差5。
- 锚定:在总样本中,成对比较任务的百分比一致性为 82.73%,显示出较高的一致性,但总体 ICC 表明锚定因子的一致性差。不同样本组在成对比较任务上有较好的一致性,但在锚定因子的 ICC 上表现不佳6。
- 效用递减和价值集:在个体层面,总体样本中 36 个效用递减的 ICC 值多数显著,其中 23 个显示一致性差,12 个为中等。普通人群样本的可靠性高于患者样本。在总体层面,测试和重测的总体效用递减相似,分布也相似78。
- 回归分析:年龄与效用递减值的累积差异有关,50 - 64 岁的参与者差异较大,但受样本类型影响。性别也有一定关联,男性的累积差异较低910。
研究结论和讨论部分指出,OPUF 方法在总体层面能为 EQ-HWB-S 生成可靠的价值集,但个体层面的任务缺乏可靠性。个体层面的不一致可能受人口统计学因素如年龄、性别影响,也可能与调查的数字性质、任务的复杂性以及参与者的理解和参与度有关。患者样本表现较差可能与年龄、疾病经历和症状变化有关。
这项研究具有重要意义。它揭示了 OPUF 在评估 EQ-HWB-S 效用值方面的优势和不足,为后续研究指明了方向。未来需要进一步探索导致个体层面不一致的原因,通过改进调查设计、增加定性研究等方式,提高 OPUF 方法的可靠性和有效性,从而更准确地评估健康相关生活质量的效用值,为健康经济决策提供更可靠的依据。