提升全球健康数据检索与利用效能的策略:基于抗菌药物耐药性研究的经验与启示
《Discover Public Health》:Strategies for identifying and using diverse global health data: perspectives from data searching and meta-analyses on antimicrobial resistance
【字体:
大
中
小
】
时间:2025年12月22日
来源:Discover Public Health
编辑推荐:
本文针对全球健康研究中数据检索存在的挑战,提出了一套系统化策略。研究人员基于抗菌药物耐药性(AMR)数据挖掘经验,从明确研究目标、选择数据库、优化检索策略到数据提取与验证,形成了一套可复用的方法框架。该研究为利用多元数据开展全面公共卫生分析提供了实用指南,特别适用于数据稀疏地区的研究。
在全球公共卫生研究领域,有效获取和利用多样化的健康数据是支撑科学决策的基石。随着数字技术的发展,研究人员已很少需要亲自前往图书馆翻阅纸质期刊,而是通过在线数据库和关键词搜索从海量资源中定位所需信息。然而,这种便利背后隐藏着巨大挑战:如何设计无偏见且高效的检索策略,使其能够跨多个数据库和资源平台稳定运行?检索结果的质量往往高度依赖于所采用的方法,而在全球健康这类数据可能分散、稀疏且采集标准不一的研究领域,这一问题尤为突出。
特别是在抗菌药物耐药性(AMR)监测这样的关键领域,数据获取的挑战更加明显。碳青霉烯类抗生素和多重耐药菌的出现,使得碳青霉烯类耐药肠杆菌目(CRE)成为临床治疗的难题。然而,在公共卫生资源有限的地区,针对CRE的监测体系往往不完善,导致人们对这类感染的流行情况、分布范围和风险认知存在显著空白。传统上,研究人员可能依赖于单一数据库或简单的关键词搜索,但这容易引入各种偏见,例如语言偏见(只收录英文文献)、出版偏见(阳性结果更容易被发表)以及数据库本身的覆盖范围限制。这些偏见可能导致对全球健康问题的理解出现偏差,进而影响防控策略的制定。
正是在这样的背景下,Danielle M. Venne及其合作者在《Discover Public Health》上发表了他们的研究成果。该团队基于在非洲和东南亚地区开展碳青霉烯类和多重耐药菌数据搜索、提取与分析的实践经验,系统梳理了从数据检索到最终利用的全流程优化策略。他们的工作表明,通过精心设计的检索方案,可以有效提升数据的代表性、全面性和可用性,从而为公共卫生实践和政策制定提供更可靠的科学依据。
为开展这项方法论研究,作者团队主要运用了多数据库协同检索、检索策略迭代优化、灰色文献补充检索、自动化去重技术与结构化数据提取验证等关键技术。研究特别关注了非洲和东南亚地区临床与流行病学数据,并通过作者查询等方式对原始数据进行了核实与补充。
研究团队从明确研究目标入手,强调清晰的研究问题是所有数据检索工作的基础。根据研究需求,团队选择了PubMed、Embase、Global Health和Web of Science四个具有不同覆盖特色的数据库,以确保检索的广度与深度。在构建检索策略时,团队采用了由三大组件(地理范围、耐药性/药物、感染/基因型)构成的复合检索式,并充分利用了布尔运算符(AND、OR、NOT)、字段标签、主题词表(如MeSH)和词干提取(如resistan*)等功能。通过迭代测试,团队评估了不同检索词对结果敏感性与特异性的影响,最终选择了以高敏感性为目标的宽泛检索策略。
在检索策略优化方面,研究展示了如何通过系统性地增删检索词来平衡敏感性与特异性。例如,团队发现若仅使用“耐药”相关术语,会漏检那些以感染为主要研究目的但同时报告了药敏结果的研究。因此,在检索式中加入“医疗保健相关感染”、“肠杆菌目”等更广泛的术语,显著提高了相关数据的捕获量,所得结果数量比使用狭窄策略或既往综述多出一个数量级。
针对非传统数据源,研究探索了灰色文献和手动检索的价值。团队通过Google Scholar、ResistanceMap、ProMED、全球指数医学目录(Global Index Medicus)等渠道,获取了未在主流生物医学数据库中索引的重要数据。在非洲CRE研究中,灰色文献来源贡献了6.8%的最终纳入数据报告。此外,通过手动筛查相关综述的参考文献列表,也发现了部分未被电子检索捕获的研究,例如在东南亚研究中,文莱的3个数据来源中有1个是通过手动检索发现的。
在数据管理与验证环节,研究团队开发了基于R语言的自动化去重程序,并利用结构化数据提取模板和双人独立核对机制确保数据质量。当原始文献数据存在模糊或缺失时,团队会联系通讯作者寻求澄清。在最近的一项研究中,他们联系了167位作者,其中51%给予了回复,最终成功纳入了55项(占纳入研究的7%)原本因信息不全可能被排除的研究的数据。
本研究系统总结了一套提升全球生物医学与公共卫生数据检索与利用效能的实用策略。该框架强调从明确研究目标出发,通过选择互补的数据库、构建并迭代优化检索策略、有效管理检索结果(包括去重和筛选),并审慎利用灰色文献和手动检索作为补充,最终通过结构化的数据提取和验证流程,构建出高质量、高代表性的数据集。研究表明,在数据稀疏的研究领域,采用高敏感性的检索策略,并辅以灰色文献和作者查询,可以显著增强数据的全面性和地理代表性。
尽管新兴的人工智能(AI)工具(如大语言模型)在文献检索和数据提取方面展现出潜力,但作者指出,目前这些工具在准确性、避免幻觉(生成虚构内容)和消除训练数据固有偏见方面仍存在局限。因此,在当前的系统评价和证据图谱研究中,人工审核和专家监督仍然不可或缺。
该研究提供的策略不仅适用于抗菌药物耐药性监测,也可为其他需要整合利用多元、分散数据的全球公共卫生研究领域提供重要参考。通过实施这些方法,研究人员能够更有效地克服数据检索中的偏差,构建出更贴合研究需求的数据集,从而为理解和应对复杂的全球健康挑战奠定更坚实的数据基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号