种族差异对EQ-5D-5L健康相关生活质量评分的影响:基于英格兰大规模人群队列的HOPIT模型分析

【字体: 时间:2025年10月24日 来源:Quality of Life Research 2.7

编辑推荐:

  本研究针对不同种族群体在自我报告健康(SRH)时存在的评分异质性可能影响健康不平等测量准确性的问题,利用英格兰全科医生患者调查(GPPS)中超过260万受访者的数据,应用分层有序概率(HOPIT)模型分析了EQ-5D-5L五个维度的评分行为差异。研究发现,在调整健康条件后,亚洲和黑人族群在焦虑/抑郁和日常活动维度上更倾向于报告较轻症状,而白人群体更倾向于选择中等严重程度级别。结果强调了在跨种族人群健康评估中调整报告异质性的重要性,对提升健康技术评估和卫生政策制定的公平性具有指导意义。

  
在日常生活中,当我们被问及“您的健康状况如何?”时,不同的人可能会给出截然不同的回答。这种自我报告健康(Self-Rated Health, SRH)的评估方式,因其简便易行,已成为社会科学研究和公共卫生监测中不可或缺的工具。从预测死亡率到估算医疗资源需求,自我报告健康数据的影响力无处不在。然而,一个长期存在的担忧是:这种主观评价是否真的可以在不同人群间进行公平比较?特别是当涉及到不同种族和文化背景的群体时,人们对“健康”的理解和表达方式可能存在系统性差异,这种差异被称为“报告异质性”(reporting heterogeneity)。如果忽视这种差异,直接比较不同种族群体的自我健康评分,可能会严重歪曲真实的健康不平等状况,进而导致公共卫生资源的错误配置和政策制定的偏差。
以广泛使用的健康相关生活质量(Health-Related Quality of Life, HRQoL)评估工具EQ-5D-5L为例,它要求受访者在五个维度(行动能力、自我照顾、日常活动、疼痛/不适、焦虑/抑郁)上选择符合自身状况的严重程度等级。以往的研究多集中于单一条目的整体自评健康,而对EQ-5D-5L这种多维工具在不同种族群体间的评分行为差异关注相对较少。英格兰作为一个拥有多元种族人口的国家,其长期存在的种族间健康不平等现象,为探究这一问题提供了理想的研究背景。传统上,研究者尝试使用“锚定情景法”(anchoring vignettes)来校正报告差异,但该方法依赖于“情景等价性”和“反应一致性”等严格假设,而越来越多的证据表明这些假设在现实中可能难以满足。因此,寻找一种更稳健的方法来剥离潜在真实健康与主观评分行为,成为该领域的一个重要挑战。
正是在这样的背景下,由Juan Marcelo Virdis、Laura Anselmi和Matt Sutton共同完成的研究《Differences in rating of health related quality of life on the EQ-5D-5L between ethnic groups》于2025年发表在《Quality of Life Research》期刊上。这项研究旨在回答一个核心问题:在控制了健康状况(以一系列自我报告的长期病症为指标)后,不同种族群体对EQ-5D-5L五个维度的评分行为是否仍然存在显著差异?
为了回答这一问题,研究人员进行了一项大规模的数据分析。他们获取了英格兰全科医生患者调查(General Practice Patient Survey, GPPS)在2012年至2017年间共九个波次的横断面数据,这些数据包含了EQ-5D-5L的应答信息。经过严格的筛选(排除25岁以下和74岁以上人群,以及处理缺失值后),最终的分析样本量达到了惊人的2,642,805人,确保了研究结果具有极高的统计效力。样本涵盖了五大种族群体:白人(88.18%)、亚洲人(6.15%)、黑人(2.65%)、混合或多重背景族群(0.95%)以及其他族群(2.32%)。
研究采用的核心技术方法是分层有序概率模型(Hierarchical Ordered Probit Model, HOPIT)。这是一种强大的统计工具,能够将影响个体健康评价的两个过程分离开来:
  1. 1.
    潜在健康状态(Latent Health Status):这是个体客观的健康水平,模型通过一组“半客观”的健康指标来估计它,包括15种自我报告的长期病症(如高血压、关节炎、心理健康问题等)以及近期因伤病导致的活动受限情况。模型还考虑了这些病症之间可能存在的两两及三重交互作用,以更准确地反映共病(multimorbidity)对健康的影响。
  2. 2.
    报告阈值(Reporting Thresholds):这是个体将潜在健康状态映射到具体评分等级(如EQ-5D-5L的1到5级)的“门槛”。模型假设这些阈值受到一系列与评分行为相关但不直接影响潜在健康状态的变量影响,包括种族、年龄、性别、所在地区的多重剥夺指数(Index of Multiple Deprivation, IMD)、近期医疗服务使用情况(如看全科医生GP或护士的频率、预约难易度)等。其中,种族是本研究关注的关键变量。
通过分别对EQ-5D-5L的五个维度建立HOPIT模型,研究人员可以量化在给定相同潜在健康水平的情况下,不同种族群体的报告阈值与参考群体(本研究设为白人群体)相比是否存在系统性偏移。
主要研究方法概述
本研究的关键技术方法包括:利用英格兰全科医生患者调查(GPPS)这一大规模、具有全国代表性的重复横断面数据库作为样本来源;采用分层有序概率模型(HOPIT)作为核心分析框架,该模型能有效分离潜在健康状态(由自我报告的长期病症和活动受限指标构成)和报告行为(受种族、人口学特征、医疗服务使用等因素影响);通过模型拟合得到不同种族群体在EQ-5D-5L各维度各等级间的报告阈值差异,并使用自助法(Bootstrap)进行统计显著性检验。此外,研究还进行了广泛的敏感性分析,包括改变模型变量设定(如将年龄、性别、剥夺指数等变量纳入潜在健康方程)、简化健康条件交互项等,以检验结果的稳健性。
研究结果
1. 潜在健康指标的有效性
模型结果显示,不同的长期病症与EQ-5D-5L的特定维度呈现出预期的强关联。例如,长期心理健康问题、阿尔茨海默病或痴呆症、长期神经系统问题与焦虑/抑郁维度的潜在健康状态关联最强(标准化系数最高)。这表明用于构建潜在健康指数的健康指标是有效的,能够捕捉到不同健康维度背后的主要病理生理负担。
2. 种族间报告阈值的系统性差异
与白人群体相比,其他种族群体在多个维度上表现出显著且具有模式性的阈值差异。总体而言,亚洲和黑人群体在多个维度,尤其是焦虑/抑郁和日常活动维度上,表现出更倾向于选择较轻严重程度等级的倾向。具体表现为,在划分等级1(无问题)和2(轻微问题)、2和3(中度问题)、以及3和4(严重问题)的阈值上,亚洲和黑人群体的阈值显著高于白人群体(差值为正)。这意味着,对于相同的潜在健康水平,亚洲和黑人背景的受访者比白人受访者更有可能报告自己处于“无问题”、“轻微问题”或“中度问题”的类别,而不是更严重的类别。
3. 维度与种族间的异质性模式
差异的模式并非在所有维度和所有种族群体中都一致。
  • 亚洲和黑人群体:在焦虑/抑郁维度,这种“乐观”报告倾向主要体现在等级1到4之间,而在最严重的等级(4和5之间)阈值差异不显著。在日常活动维度,这种正向差异也普遍存在。
  • 其他族群:该群体表现出一种独特的“两极分化”模式。在焦虑/抑郁维度,他们更倾向于选择最轻的等级(阈值1-2为正)和最重的等级(阈值4-5为负)。这意味着,相对于白人,其他族群的成员在焦虑/抑郁问题上,要么报告得更好,要么报告得更差,而较少选择中间等级。
  • 混合或多重背景族群:该群体的报告阈值与白人群体最为接近,大多数差异在统计上不显著。
  • 不同严重等级的差异:研究还发现,即使在同一个维度和同一个种族群体内,差异的方向和大小也可能因所比较的严重程度等级而异。例如,亚洲群体在自我照顾维度,阈值1-2为正(更倾向报告无问题),但阈值4-5为负(更倾向报告极端问题)。类似情况也出现在黑人群体的行动能力维度。
4. 敏感性分析与亚组异质性
敏感性分析表明,当模型中未纳入地区剥夺指数和医疗服务使用变量时,部分种族差异的估计值会发生显著变化,甚至符号反转,这提示社会经济因素和医疗接触经验可能部分地中介或混淆了种族与报告行为之间的关系。然而,关于亚洲和黑人群体在焦虑/抑郁和日常活动维度上更倾向报告较轻症状的核心发现,在不同模型设定下均保持稳健。此外,对更细分的种族亚组(如白人群体中的爱尔兰裔、吉普赛或爱尔兰旅行者;亚洲群体中的华人、印度人等)的分析揭示了主要种族类别内部也存在显著的异质性,强调了种族分类的复杂性。
结论与意义
本研究通过应用HOPIT模型分析超260万人的大数据,提供了强有力的证据,表明在英格兰人口中,不同种族背景的个体在对EQ-5D-5L这一重要健康评估工具的应答上存在系统性的报告异质性。即使在控制了广泛的健康条件后,这种差异依然存在。主要结论可归纳为:白人群体在评分时表现出选择中间等级的倾向;亚洲和黑人群体在焦虑/抑郁和日常活动等维度上更可能报告较好的健康状况;而其他族群则显示出选择极端等级(最好和最差)的倾向。这些差异在不同健康维度和严重程度等级上表现出复杂的模式。
这一发现具有重要的理论和实践意义。在理论层面,它支持了社会学和健康心理学中的观点,即健康感知受到文化背景、社会规范(例如,对心理健康的污名化可能影响其报告)和比较标准(个体与谁比较来判断自己的健康)的深刻影响。不同族群可能拥有不同的“健康参照系”,从而导致评分行为的差异。
在实践层面,本研究对健康测量、政策制定和研究方法的启示是深远的:
  1. 1.
    健康不平等监测:直接比较未校正的自我报告健康数据可能会低估或高估种族间的真实健康差距。例如,如果某个群体倾向于“弱化”健康问题的报告,其真实的健康劣势可能被掩盖。
  2. 2.
    健康技术评估(Health Technology Assessment, HTA):EQ-5D-5L常用于计算质量调整生命年(QALYs),以评估医疗干预的成本效益。报告异质性可能导致基于种族背景的QALYs计算偏差,进而影响医疗资源分配的公平性。
  3. 3.
    研究方法学:研究结果强烈建议,在涉及多元种族人群的研究中,应尽可能采用诸如HOPIT模型或谨慎使用下的锚定情景法等统计技术来校正报告异质性。当校正不可行时,至少应进行敏感性分析,以评估不同报告行为对研究结论可能产生的影响。
当然,研究也存在一些局限性,例如依赖自我报告的病症(其本身也可能存在报告差异)、未能包含所有可能影响评分行为的社会经济变量、以及数据缺失可能带来的偏倚等。未来的研究需要结合更客观的健康测量指标,并深入探索导致报告异质性的具体文化、心理和社会机制。
总而言之,Juan Marcelo Virdis及其同事的这项研究清晰地揭示,在衡量健康这把“尺子”上,不同种族群体可能使用着不同的“刻度”。认识到这一点,并采取适当的方法进行校准,对于我们更准确、更公平地理解和改善所有人的健康至关重要。这项发表于《Quality of Life Research》的工作,为迈向更加公平的健康评估实践提供了关键的科学依据。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号