在线个人效用函数(OPUF)方法中参与者对问题理解程度研究:EQ-HWB-S(EQ 健康与幸福简版)评估的认知复述

【字体: 时间:2025年05月18日 来源:Quality of Life Research 3.3

编辑推荐:

  推荐 为明确参与者对在线个人效用函数(OPUF)任务的理解与参与情况,研究人员针对 OPUF 评估 EQ-HWB-S 展开认知复述访谈。结果显示 27 例访谈均存至少轻微问题,67% 有重大问题,提示需改进 OPUF 数据收集方式以保障质量。

  

论文解读


在医疗决策中,质量调整生命年(QALYs)是评估治疗效果的核心指标,它通过健康相关生活质量(HRQoL)与生存时间的结合来量化健康收益。传统的健康状态估值方法如时间权衡法(TTO)虽被广泛应用,但存在样本需求量大、任务复杂度高的局限。近年来,在线个人效用函数(Online Personal Utility Functions, OPUF)作为一种创新的偏好诱导技术,通过整合排序、摇摆加权(swing-weighting)、水平评分(levels-rating)等多任务,试图更高效地直接获取个体对健康状态的偏好值。然而,该方法在推广应用中面临关键挑战:参与者能否准确理解任务要求?其响应是否能真实反映偏好?这些问题直接关乎估值数据的有效性,却长期缺乏系统性探究。

为填补这一研究空白,英国谢菲尔德大学(University of Sheffield)与墨尔本大学(University of Melbourne)等机构的研究团队,针对 EQ-HWB-S(EQ 健康与幸福简版)这一涵盖健康、社会照护及照护者相关生活质量的新型通用量表,开展了 OPUF 方法的认知有效性研究。该研究成果发表于《Quality of Life Research》,为优化在线健康状态估值方法提供了重要实证依据。

研究方法


研究采用认知复述(Cognitive Debrief)访谈技术,结合 “有声思维(Think-Aloud)” 与探究性提问,系统捕捉参与者完成 OPUF 任务时的思维过程。27 名英国成年参与者通过 Prolific 平台招募,覆盖不同性别、年龄及健康状况,在屏幕共享环境下独立完成包含五个核心任务的在线调查:

  1. 维度排序任务(Ranking Task):对 EQ-HWB-S 的九个维度在最差状态下进行重要性排序;
  2. 摇摆加权任务(Swing-Weighting Task):以排序最高的维度为基准,比较各维度从最差到最佳状态的改善重要性;
  3. 水平评分任务(Levels-Rating Task):使用滑动条对各维度的中间水平进行评分;
  4. 成对选择任务(Pairwise Choice Task):比较 “最差健康状态” 与 “死亡” 的偏好;
  5. 锚定死亡任务(Anchoring Dead Task):在视觉模拟量表(VAS)上为偏好状态赋值。

访谈全程录像并转录,采用框架分析法(Framework Approach)对数据进行编码,依据任务完成符合预期程度、是否存在界面混淆或量表解读偏差等标准,将问题分为 “轻微关注(Minor Concern)” 与 “重大关注(Major Concern)”,后者被视为可能损害响应有效性。

研究结果


  1. 任务完成整体状况
    所有 27 例访谈均存在至少一项轻微或重大问题,其中 18 例(67%)存在重大关注,涉及四个核心任务。从任务维度看,水平评分任务(56%)与锚定死亡任务(48%)的重大问题发生率最高,摇摆加权任务(30%)与排序任务(19%)次之,而成对选择任务相对表现较好,67% 的参与者能按预期完成。

  2. 关键问题类型


  • 排序任务:部分参与者误将当前健康状态代入假设情境(R3.1),或颠倒排序方向(R3.2),导致基准维度锚定错误;
  • 摇摆加权任务:30% 的参与者对 “100 分” 基准的理解偏差显著,如将其解读为 “完全改善” 而非相对重要性(S3.2),或因忽视参考维度导致评分逻辑混乱(S2b.9);
  • 水平评分任务:56% 的参与者受量表方向混淆(L3.4)、响应水平语义模糊(如 “偶尔” 与 “有时” 的区分,L2c.1)等问题困扰,甚至出现逆向评分(较差状态得分高于较好状态);
  • 锚定死亡任务:48% 的参与者对 “死亡” 锚点的定位偏离 QALY 量表逻辑,例如将 “死亡” 赋值为 100(与 “无健康问题” 混淆,D3.5),或基于个人耐受度而非偏好估值(D3.7)。

  1. 年龄效应
    50 岁以上参与者在摇摆加权(36% vs. 14%)、水平评分(64% vs. 43%)及锚定死亡任务(57% vs. 36%)中的重大问题发生率显著更高,提示老年群体可能因认知负荷或技术适应差异面临更大挑战。

结论与讨论


本研究通过深度认知访谈揭示了 OPUF 方法在在线实施中的潜在缺陷:参与者对多任务的理解偏差普遍存在,量表逻辑不一致、界面设计缺陷及 EQ-HWB-S 条目歧义等因素,共同导致数据有效性受损。尽管 OPUF 在样本效率上优于传统分解法,但其自动化在线模式可能加剧 “指令漏读”“量表误判” 等问题,尤其对老年或非专业群体影响显著。

研究强调,完全依赖无监督在线数据收集存在风险,建议借鉴原始 PUF 方法的访谈引导模式,通过引入研究者实时辅助(如澄清任务逻辑、纠正量表误解)提升数据质量。同时,界面优化(如固定量表方向、强化基准说明)与量表条目修订(如明确响应水平定义)可作为补充策略。这些发现不仅为 OPUF 的方法学改进提供了路径,也为其他在线健康估值工具的开发敲响了警钟 —— 认知有效性检验应成为方法学验证的核心环节,而非仅依赖事后统计筛选。

未来研究需进一步探索混合式数据收集模式(如访谈引导与在线自填结合)的可行性,并通过重测信度(Test-Retest Reliability)等量化指标验证改进措施的实际效果。在追求估值效率的同时,确保数据真实反映公众偏好,是提升健康经济决策科学性的必要前提。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号