成人群体中EQ-5D-Y-3L与EQ-5D-3L测量性能比较:来自匈牙利人口样本的实证研究

《The European Journal of Health Economics》:Comparing the measurement properties of the EQ-5D-Y-3L and EQ-5D-3L in a general population sample of adults

【字体: 时间:2025年10月19日 来源:The European Journal of Health Economics 3.1

编辑推荐:

  【编辑推荐】为探究不同年龄段适用版本的EQ-5D量表在成人群体中的测量差异,研究团队对1196名匈牙利成人开展横断面研究。结果显示:EQ-5D-Y-3L(青少年版)相比成人版EQ-5D-3L具有更低的天花板效应(34.8% vs 46.8%)和更高信息量(J'=0.47 vs 0.40),尤其在心理健康维度(焦虑/抑郁 vs 担忧/悲伤/不开心)差异显著(Kendall's τ=0.636)。研究表明量表转换需谨慎,Y-3L版本在成人群体中可能具有独特优势。

  
在健康经济学和临床研究领域,准确测量健康相关生命质量(HRQoL)对于评估医疗干预效果至关重要。其中,EQ-5D系列量表作为国际通用的偏好伴随测量工具(PAMs),通过将健康状况转化为可量化的指数值,为成本效用分析和质量调整生命年(QALYs)计算提供核心数据。然而,一个长期存在的实践难题是:针对不同年龄群体设计的量表版本之间是否存在测量差异?特别是当患者从儿童期过渡到成年期时,从青少年版EQ-5D-Y-3L(Y-3L)转换为成人版EQ-5D-3L(3L)的过程是否会影响健康评估的连续性和可比性?
这一问题在健康技术评估(HTA)实践中尤为突出。慢性疾病治疗、罕见病干预和儿童疫苗接种等场景往往需要跨生命周期的HRQoL测量。尽管目前指南建议在成年后从Y-3L切换至3L,但两种工具在措辞上的显著差异可能引入测量偏差。例如,3L使用"焦虑/抑郁"这样的临床术语,而Y-3L则采用"感到担忧、悲伤或不开心"这样更通俗的表达。这种语言差异是否会导致同一成年人群报告不同的健康状态?更值得深思的是,对于识字率较低或存在认知障碍的成人群体,Y-3L的简化语言是否反而能提高自我报告的准确性?
此前的研究主要集中在青少年群体的量表转换,而针对成年人的比较证据十分有限,特别是在中欧和东欧地区尚属空白。匈牙利作为已同时建立3L和Y-3L价值集的国家,为开展此类研究提供了独特条件。在这一背景下,由Anna Nikl领衔的研究团队在《The European Journal of Health Economics》发表了一项开创性研究,首次在匈牙利成人一般人群中系统比较了Y-3L和3L的测量性能。
研究方法上,团队采用横断面设计,招募了1,196名18岁及以上成人,样本年龄和性别分布与匈牙利人口普查数据保持代表性。数据收集结合在线调查(n=996)和计算机辅助面访(CAPI,n=200)两种模式。所有参与者先完成匈牙利版Y-3L,随后进行偏好引导任务,最后填写3L量表和包含社会人口学特征、自评健康状况及12种慢性病病史的结构化问卷。统计分析涵盖天花板效应、地板效应、信息量(Shannon指数H'和均匀度指数J')、维度间一致性(Kendall's tau)和已知群体效度(效应量ES和相对效率RE)等指标,并采用Bland-Altman分析和组内相关系数(ICC)评估工具间一致性。
维度水平分析结果显示,Y-3L在所有维度上均表现出更优的测量特性。在心理健康维度,Y-3L的"担忧/悲伤/不开心"仅有56.8%的受访者报告"无问题",显著低于3L"焦虑/抑郁"维度的71.6%(p<0.05)。相对信息量(J')在Y-3L各维度均更高(范围:0.20-0.75 vs 3L的0.18-0.66)。维度间一致性最强的是移动能力(Kendall's τ=0.841),最弱的是心理健康维度(τ=0.636)。交叉表分析进一步揭示,22.9%在3L上报告无焦虑/抑郁的受访者在Y-3L上报告至少存在轻度担忧/悲伤/不开心。
健康状态分布分析表明,Y-3L捕获的健康状态多样性显著高于3L。虽然两种工具理论上均可描述243种健康状态,但Y-3L在实际中观察到85种独特状态(占35.0%),而3L仅观察到47种(19.3%)。仅有59.0%的参与者报告了完全一致的健康状态描述,当排除完全健康状态("11111")后,一致性进一步降至26.1%。Y-3L的整体天花板效应显著较低(34.8% vs 46.8%,p<0.05),指数值分布的均匀度也更高(J'=0.47 vs 0.40)。
工具间一致性分析通过Bland-Altman图可视化显示,Y-3L指数值平均比3L低0.046(95%一致性界限:-0.285至0.194),水平总和分数(LSS)平均高3.53分(界限:-13.94至21.00)。这种差异在健康状况较差的人群中更为明显。组内相关系数(ICC)分析显示,LSS的ICC为0.811(0.734-0.860),指数值的ICC为0.735(0.649-0.795),表明工具间一致性为良好至优秀。
已知群体效度分析证实两种工具均能有效区分不同健康状态群体。在自评健康状况和慢性病分组比较中,Y-3L和3L均呈现中等到大的效应量(ES)。Y-3L在62-69%的已知群体比较中显示出更高的判别效能(RE>1)。特别值得注意的是,在焦虑症患者组中,3L表现出显著更高的判别效率(RE=0.844,95%CI:0.758-0.927),这可能反映了3L临床术语对确诊患者群体的特殊敏感性。
亚组分析显示,不同调查模式(在线vs面访)下上述结论保持一致,证实了研究结果的稳健性。在线样本中Y-3L的天花板效应为31.2%,面访样本为52.5%,均显著低于对应模式下3L的表现(44.1%和60.5%)。
本研究通过严谨的设计和全面的分析,揭示了Y-3L和3L在成人群体中存在的系统性差异。这些发现对健康经济学研究和临床实践具有重要启示:首先,在纵向研究和经济评估中,从Y-3L到3L的转换需要谨慎处理,可能需要建立跨工具等值映射函数;其次,Y-3L简化语言在成人群体中表现出的优势,特别是对心理健康问题的更敏感检测能力,提示其在特定人群(如低识字率群体)中可能具有独特应用价值;最后,研究强调了对HRQoL测量工具进行系统性比较的重要性,特别是在跨文化背景下。
研究的局限性包括固定问卷顺序可能带来的顺序效应、COVID-19大流行对心理健康报告的可能影响,以及Y-3L缺乏成人专用价值集导致的指标选择限制。未来研究可聚焦于开发量表间的等值转换算法,探索Y-3L在特殊成人群体中的应用潜力,并开展纵向研究追踪个体从青少年到成年期的量表转换过程。
总之,这项研究为理解不同EQ-5D版本在成人群体中的测量特性提供了重要证据,强调在生命周期HRQoL评估中需要更加重视测量工具的协调性和连续性。随着个性化医疗和全生命周期健康管理的发展,确保健康测量工具的一致性和可比性将成为健康经济学研究的关键挑战之一。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号