编辑推荐:
低应答率致人群赌博调查结果偏倚风险上升,本研究针对芬兰 2016 年混合模式赌博危害调查(应答率 36.2%),通过行政登记数据结合多重插补(MI)调整无应答偏倚。发现问题赌博调整患病率(2.8%)显著高于粗率(1.9%),证实无应答对结果的影响,为提升调查可靠性提供新方法。
在人口健康研究领域,赌博行为及其危害的准确评估一直是公共卫生关注的重点。然而,近年来各类调查普遍面临应答率下降的挑战,尤其是在赌博相关研究中,低应答率可能导致选择性偏倚,掩盖真实的人群患病情况。例如,在芬兰等西方国家,尽管采用在线与邮寄混合模式的调查已成为主流,但 30%-40% 的应答率甚至被视为 “良好”,这使得非应答者的特征及其对结果的影响成为亟待解决的问题。特别是问题赌博作为一种与社会人口学因素(如性别、年龄、社会经济地位等)密切相关的公共卫生问题,非应答者中可能富集高风险人群,导致调查结果低估实际危害。
为了填补这一研究空白,芬兰卫生与福利研究所(THL)的研究人员开展了一项针对 2016 年芬兰赌博危害调查(Finnish Gambling Harms Survey 2016)的深入分析。该研究旨在评估无应答偏倚对赌博参与率和问题赌博患病率的影响,并探索利用行政登记数据调整偏倚的可行性。研究成果发表在《BMC Public Health》,为提升人群调查的准确性提供了重要方法学参考。
研究采用混合模式调查设计,样本覆盖芬兰三个地区(Uusimaa、Pirkanmaa、Kymenlaakso),共纳入 19,741 名 18 岁以上个体,应答率为 36.2%。研究的关键技术方法包括:
- 数据链接与变量构建:通过个人识别码将调查样本与芬兰统计局的行政数据链接,获取性别、年龄、居住区域、家庭结构、家庭 equivalised 可支配收入(HEDI)、教育程度、就业状态、母语等社会人口学变量。
- 多重插补(MI):使用 R 软件的 mice 包,基于社会人口学变量构建插补模型,对非应答者的赌博参与和问题赌博状态进行模拟,生成 10 份完整数据集并合并分析。
- 统计比较:对比粗患病率、加权患病率(基于设计权重和校准权重)与无应答调整后的患病率,通过 t 检验评估差异显著性。
研究结果
1. 应答率的社会人口学差异
应答率在不同亚组间差异显著(16.8%-51.4%):女性、55-84 岁、仅成人家庭、HEDI 中高 tertile、高等教育、白领及退休人群应答率较高;而男性、18-54 岁及 85 岁以上、独居或有子女家庭、HEDI 最低 tertile、低教育程度、失业或蓝领、母语非芬兰 / 瑞典语者应答率较低。
2. 赌博参与率的偏倚评估
粗患病率为 81.9%(95% CI 81.0–82.8%),加权患病率 83.2%(p=0.09),无应答调整后为 82.3%(p=0.49),三者无统计学差异。这表明赌博参与率在现有样本中已具有较好代表性,可能与高应答亚组(如男性、高龄、高社会经济地位)本身参与率较高有关。
3. 问题赌博患病率的偏倚评估
粗患病率为 1.9%(95% CI 1.6–2.3%),加权患病率 2.2%(p=0.26),而无应答调整后显著升高至 2.8%(p=0.002)。亚组分析显示,男性、城市居民、母语为芬兰语者的调整患病率显著高于粗率,提示这些亚组的非应答者中问题赌博风险更高。
结论与讨论
研究证实,无应答偏倚对问题赌博患病率的影响显著,而对赌博参与率影响有限。这一差异可能与社会人口学因素对两类结局的不同关联有关:问题赌博更易受低社会经济地位、年轻男性等低应答亚组的影响,而赌博参与率的高应答亚组特征(如高龄、高教育程度)与参与行为本身正相关,抵消了部分偏倚。
行政登记数据与多重插补技术的结合为无应答偏倚的调整提供了创新方法。传统加权方法仅基于有限变量(如性别、年龄),而本研究通过纳入多维社会人口学信息,更精准地模拟了非应答者特征。这一方法学突破为类似人群调查(如成瘾行为、心理健康研究)提供了参考,尤其适用于存在行政数据可及性的国家或地区。
此外,研究结果强调了在数据分析中常规评估无应答偏倚的必要性。尽管混合模式调查已优化应答率,但特定亚组(如年轻男性、低社会经济群体)的招募困难可能导致关键健康指标的低估。未来研究需进一步探索个性化数据收集策略(如针对高风险亚组的短问卷设计、多模式接触),并结合健康登记数据完善偏倚调整模型,以更全面地反映人群健康状况。
本研究不仅深化了对赌博相关调查偏倚的理解,也为公共卫生领域提升观察性研究质量提供了实证依据,其方法学价值将推动更多基于行政数据的偏倚校正研究,助力更可靠的政策制定与干预措施设计。