填补空白:统计方法学研究的公众参与式术语表开发与应用

《Research Involvement and Engagement》:‘Plugging the gap’: development of a plain language glossary for statistical methodology research

【字体: 时间:2025年10月19日 来源:Research Involvement and Engagement

编辑推荐:

  为解决统计方法学研究因专业术语障碍导致患者与公众参与(PPIE)不足的问题,英国莱斯特大学研究团队通过人工智能辅助与三轮公众反馈,开发出包含64个术语的简明语言术语表,有效提升公众对贝叶斯分析、Meta分析等复杂概念的理解,为方法学研究领域的公众参与提供了标准化沟通工具。

  
在当今健康研究领域,患者与公众参与(Patient and Public Involvement and Engagement, PPIE)已成为提升研究质量与实用性的关键环节。然而,这种参与在统计方法学研究中却面临独特挑战——当研究人员讨论马尔可夫链蒙特卡洛(Markov Chain Monte Carlo, MCMC)方法、灵活参数模型或风险比(hazard ratio)时,复杂的专业术语往往成为公众理解的障碍。英国医学研究理事会(Medical Research Council, MRC)和国家健康与护理研究所(National Institute for Health and Care Research, NIHR)虽已强制要求资助项目必须包含PPIE,但统计方法学研究者普遍反映缺乏专门针对本领域的公众沟通资源。
这种沟通鸿沟不仅限制了公众参与的质量,更可能影响研究本身的社会相关性。统计方法学研究通过开发新的数据分析工具,直接影响健康技术评估和临床指南的制定,进而改变医疗政策和服务提供方式。若公众因术语障碍而无法有效参与,研究成果的适用性和公平性将大打折扣。莱斯特大学生物统计研究组的调查显示,尽管研究人员认可PPIE的价值,但72%的受访者认为统计方法学的技术性使公众难以理解,83%希望获得专门为统计研究设计的PPIE资源。
为破解这一难题,研究团队开展了名为"填补空白"的创新项目,旨在开发专门针对统计方法学研究的简明语言术语表。该研究遵循系统化开发流程,首先通过范围审查识别现有术语表的不足,然后利用人工智能生成初始定义,最后通过多轮公众反馈循环进行优化。整个过程严格遵循GRIPP2报告规范,确保方法学的严谨性与参与的有效性。
研究方法的核心在于四个递进阶段:需求识别、初始开发、PPIE反馈循环和资源发布。团队首先扫描了NICE、NIHR、BMJ等五个权威术语表,发现这些资源虽包含基础统计术语,但缺失了方法学研究中的关键概念。通过与生物统计研究组45名成员的深入讨论,最终确定了64个需要定义的空白术语,涵盖生存分析、证据合成、贝叶斯统计等核心方法学领域。
在定义生成环节,研究人员创新性地采用ChatGPT(GPT-3.5)作为辅助工具,要求其生成阅读年龄低于10岁的定义。但发现单纯追求低阅读年龄可能导致示例幼稚化(如将估计目标描述为"统计学的藏宝图"),因此调整为"简明英语"与适当阅读年龄相结合的灵活策略。为确定最佳语言难度,团队还准备了三个版本的定义(低阅读年龄、简明英语、专业版本)供公众比较选择。
PPIE反馈机制体现研究的创新性。第一组PPIE成员(5人)具有统计研究参与经验,他们明确倾向阅读年龄低于10岁的定义,认为这更利于非英语母语者理解,并强调定义开头应直接说明术语含义,辅以生活化示例。第二组PPIE成员(5人)虽无方法学研究经验,但提出关键改进建议:定义长度应缩短,避免使用可能污名化的人类特征(如身高体重)作为示例,转而采用植物生长等中性案例。表2清晰展示"回归"定义如何从初始版本"帮助理解事物如何协同工作的工具"逐步优化为"帮助发现数据模式的工具,如通过植物叶片数量与高度的关系示例"。
研究结果部分通过系统化展示术语表的开发历程与优化成果。术语审查阶段发现,现有五个术语表均未能覆盖统计方法学的核心概念,如风险比、贝叶斯先验、随机效应模型等。定义优化过程中,PPIE反馈促使团队平衡专业准确性与通俗性——当低阅读年龄要求与术语准确性冲突时(如"风险"和"删失"),适当放宽语言限制以确保统计含义正确。最终成果是通过三轮迭代形成的64个术语定义,每个均满足以下标准:以术语直接解释开头,包含中性易理解的示例,语言简洁(平均每个定义3句以内)。
术语表的实际应用价值已在多个场景得到验证。例如,"马尔可夫链蒙特卡洛(MCMC)"的定义从技术性描述"用于近似复杂概率分布的数值技术"转化为"通过随机抽样解决复杂问题的工具,如同多次抛硬币探索概率规律",使公众能理解这一高级统计概念。术语表以可编辑Word文档形式发布在NIHR莱斯特生物医学研究中心网站,允许研究者根据项目需求选择相关术语,极大提升实用性。
讨论部分强调术语表的方法学创新与领域适用性。研究团队指出,ChatGPT在保持术语准确性前提下实现语言通俗化方面表现出色,但建议后续研究可尝试用"入门三级语言"替代具体阅读年龄指标,避免示例幼稚化。术语表并非试图取代现有资源,而是作为"插件"填补专业术语空白,特别适合生存分析和证据合成两大方法学子领域。值得注意的是,术语表持续进化——团队已获得资金支持开发可视化辅助材料,未来版本将包含神经多样性友好的图形解释。
该研究的局限在于PPIE成员均具有应用研究参与经验,未能完全代表统计方法学研究的绝对新手群体。此外,某些核心术语(如"预测")难以找到更简单的替代词而不损失专业含义。尽管如此,这项研究首次系统化解决统计方法学PPIE的术语障碍问题,为方法学研究的公众参与树立新标准。
结论确认简明语言术语表是促进统计方法学PPIE的有效工具。通过结合人工智能与结构化公众反馈,研究成功开发出兼具专业性和可读性的沟通资源。随着可视化元素的加入和持续迭代,这一术语表将进一步提升方法学研究的包容性与社会影响力,最终使统计方法创新能更有效地服务于公众健康需求。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号