皮肤科在线调查研究的真实性危机:如何识别与防范欺诈性应答
《Clinical and Experimental Dermatology》:Online Survey Research in Dermatology: Are Your Participants Who You Think They Are?
【字体:
大
中
小
】
时间:2025年11月23日
来源:Clinical and Experimental Dermatology 2.8
编辑推荐:
本刊推荐:针对在线调查中日益严重的欺诈与机器人应答威胁数据完整性问题,研究人员以儿科湿疹远程会诊体验调查为例,开展了一项主题研究。结果发现95.7%的初始应答存在欺诈特征,并通过改进方案验证了防范措施的有效性。该研究为皮肤科在线研究提供了系统的REAL框架(预防-识别-管理),对保障科研数据质量具有重要意义。
在数字化浪潮席卷医疗研究的今天,在线调查因其成本效益和高效性已成为皮肤科研究的重要工具。通过社交媒体招募参与者更是让研究人员能够轻松触达广泛人群。然而,在这片便捷的科研新天地里,一个隐蔽的威胁正在悄然增长——欺诈性应答和机器人(bot)应答。这些不请自来的“参与者”不仅严重威胁着数据的真实性,还大量浪费着宝贵的研究经费和科研人员的时间。当研究者满怀期待地打开问卷回收平台,看到的可能不是真实的患者反馈,而是由自动化程序批量生成的、旨在获取经济奖励的虚假数据。这个问题在提供经济激励的在线调查中尤为突出,正逐渐发展成为健康研究领域的一个普遍性挑战。
正是在这样的背景下,发表在《Clinical and Experimental Dermatology》上的一项研究为我们敲响了警钟。由Natalie King Stokes领导的研究团队在开展一项关于青少年及其父母对儿科湿疹远程会诊体验的调查时,亲身经历了这场“机器人入侵”。该研究旨在了解患者群体对远程医疗服务的接受度和偏好,这本是一项极具现实意义的研究。然而,在通过社交媒体平台发布问卷并提供购物券抽奖机会后,研究团队在24小时内收到了138份回复,远超预期。欣喜之余,仔细审查数据的科研人员却发现了令人担忧的迹象:大量回复显示出明显的欺诈特征,最终确认其中高达95.7%的应答可能是虚假的。
为了开展这项研究,研究人员采用了在线问卷调查的方法,使用Jisc Online Survey平台收集数据。研究对象为13-16岁的青少年及其父母,这些参与者均有在二级/三级医疗机构进行湿疹远程会诊的经验。研究通过社交媒体(X、Instagram、Facebook)和英国国家湿疹协会网站进行招募,最初提供了购物券抽奖作为激励。在遭遇欺诈性应答后,研究团队修改了方案,去除了经济激励,增加了陷阱问题和重复问题,并重新获得了伦理委员会批准后继续开展调查。
研究人员详细描述了遭遇欺诈性应答的经历。在最初的138份回复中,发现了多个可疑指标:68.1%的回复中电子邮件地址包含的姓名与调查中提供的参与者姓名不匹配;21.7%的回复使用了随机字母数字组合的电子邮件地址;92.8%的回复呈集群式出现,即多个调查同时开始和完成;76.1%的回复包含与其他参与者完全相同的自由文本回答。此外,欺诈性回复中还包含不一致和不合逻辑的答案,例如29.7%的回复在资格问题中选择了有远程会诊经验,却在后续问题中声称只经历过面对面预约。一些人口统计学数据也与英国湿疹患儿的实际情况不符,如高比例的患者有私人预约经历(42.8%)、相对高比例的儿童接受系统性治疗(29%),以及仅有20.3%的患者被处方润肤剂。
通过对比分析,研究人员总结出欺诈性应答与真实应答的关键区别特征。真实应答的参与者往往选择退出抽奖,回答问题一致,自由文本回答个性化且显示出对湿疹治疗的内部知识(如对特定药物或护理流程的熟悉度)。而欺诈性应答则表现出短完成时间、不合逻辑的回答、重复的自由文本以及非常规时间(如深夜)提交等特征。
研究指出,预防机器人参与的措施应纳入调查设计和平台选择考量。具有机器人预防功能的平台,如“完全自动化的公共图灵测试”(CAPTCHA)和使用cookie限制多次回复的功能很有帮助,但并非万无一失。例如,虚拟专用网络(VPN)可以掩盖互联网协议(IP)地址,从而绕过这些限制。
调查的广告和分发方式需要慎重考虑。通过社交媒体广告的调查被认为具有更高的机器人应答风险。研究人员应权衡通过社交媒体广告的风险与收益,并考虑更集中的招募策略。对于皮肤科研究,通过患者支持团体邮件列表或新闻通讯可能更安全地触达参与者。从诊所招募会更可靠,但会将研究限制在单中心并降低匿名性。招募英国国家医疗服务体系(NHS)患者还需要特定的健康研究管理局伦理委员会批准。
经济补偿通常用于调查中以帮助提高招募率,但它是非法参与的主要动机。如果提供报酬,建议避免广告宣传这一点。先前的研究表明,抽奖而不是直接补偿可能会阻止欺诈性参与,但这在本研究中并未奏效。
使用能够收集IP地址等元数据的调查平台可能有助于识别欺诈性应答,除非使用了VPN。其他措施可以纳入调查设计中。自由文本问题有助于识别真实应答,这些应答展示了对疾病和治疗的内部知识。自由文本问题也可能帮助标记自动化应答,例如多个调查具有重复答案。随着人工智能(AI)驱动的机器人变得更加复杂,区分真实与虚假应答可能变得更加困难。可以在调查中加入注意力检查问题以检验参与度,重复问题可以检查一致性。一些调查平台允许设置隐藏问题,这些问题对人类参与者不可见,但会被机器人自动完成。研究人员可以考虑收集个人标识符,这些标识符可以在调查完成前或完成后进行验证。然而,缺乏匿名性可能会降低参与率,特别是在涉及敏感话题时。
研究方案中应包括处理潜在欺诈性应答的计划。研究人员应考虑可疑和非可疑应答可能的表现形式,并定义排除标准。先前的研究,如本研究,报告了在调查首次开放后不久即遭到机器人渗透的情况,因此建议从一开始就密切监控回复。如果怀疑遭到机器人攻击,应关闭调查以审查和管理回复。研究人员应通知其机构并寻求建议。处理欺诈性应答的过程应包含在参与者信息单中,以便参与者理解如果不符合资格,其回复可能会被排除。
自本研究经验以来,报告机器人参与调查的研究数量不断增加。尽管如此,《互联网电子调查结果报告清单》(CHERRIES)尚未更新以反映此问题。更新这些报告指南非常重要,以提示研究人员在发布调查数据时报告他们如何处理潜在欺诈性应答。通过分享我们的经验和建议,我们希望提高皮肤科研究人员和审稿人对这一日益增长的数据完整性威胁的认识。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号