编辑推荐:
在健康偏好研究中,针对最佳 - 最差缩放法(BWS)等研究存在的欺诈性应答者及数据欺诈问题,研究人员开展了一项针对加拿大炎症性肠病(IBD)患者医疗服务的 BWS 在线调查。结果发现额外审查和年龄验证能更好分类应答者,也明确了防欺诈有效方法,为相关研究提供重要参考。
在健康偏好研究领域,尤其是针对最佳 - 最差缩放法(Best-Worst Scaling,BWS)以及具有非有序属性的离散选择实验,在预防、识别和管理欺诈性应答者与数据欺诈方面,相关证据和指导十分有限。研究人员以一项遭遇数据欺诈的 BWS 调查为例,开展了深入研究。
研究人员对加拿大炎症性肠病(Inflammatory Bowel Disease,IBD)患者进行了一项关于医疗服务的在线 BWS 调查。他们采用三步法对应答者进行识别、验证和分类,将其分为可能欺诈(Likely Fraudulent,LF)、可能真实(Likely Real,LR)和不确定三类。首先,对 12 个 “危险信号” 变量(被认定为欺诈指标的变量)的回答进行编码,0 表示通过,1 表示未通过,将这些分数相加得出 “欺诈性应答得分”(Fraudulent Response Score,FRS),分数范围为 0 - 12 分,分数越高越可能存在欺诈,以此对应答者进行初步分类。其次,对被归为 LR 或不确定类别的应答者进行年龄验证。最后,根据年龄验证结果更新分类。研究人员运用条件 logit 模型和潜在类别分析对 BWS 数据进行分析,并依据最终分类、FRS 和危险信号变量进行亚组分析 。
研究结果显示,共有 4334 名应答者参与了初始分类,其中 24%(n = 1019)被归为 LF,76%(n = 3315)需要进一步审查。审查后,75%(n = 3258)被认定为 LF,484 名应答者进行了年龄验证。基于年龄验证结果更新分类后,最终分类结果为 76%(n = 3297)为 LF,14%(n = 592)为不确定,10%(n = 442)为 LR,还有不到 1%(n = 3)是 LR 的重复样本。BWS 项目的排名因应答者类别不同而存在显著差异。潜在类别分析表明,最终分类与类别成员身份显著相关;第 1 类的特征与 LR 应答者相符,其项目排名顺序与 LR 应答者的条件 logit 结果高度一致。可疑电子邮件是最常出现问题的危险信号变量,且与欺诈性应答者相关。
研究结论表明,额外的数据审查和年龄验证步骤比仅依靠 FRS 或单个危险信号变量能实现更好的分类效果。电子邮件认证、一次性 / 唯一调查链接以及内置身份验证可能是预防欺诈最有效的方法。在健康偏好研究中,特别是在涉及非有序属性的研究中,需要制定良好的研究实践指南,以确定预防、识别和管理欺诈性数据的最有效和高效的方法。