编辑推荐:
为解决微生物组研究数据标准和管理问题,研究人员开展相关工作坊并调查,发现成效显著,推动数据规范应用。
在微生物组研究的广阔领域中,它就像一座充满宝藏但尚未被完全开发的矿山,横跨从人类健康到农业、再到水生系统功能等多个领域,不断吸引着科研人员深入探索。随着研究的深入,多组学(multi-omics)方法被广泛应用,能产生大量复杂的数据,这些数据犹如一把把钥匙,有望解锁微生物群落的基因组组成和功能潜力的秘密。然而,当前微生物组研究数据的 “钥匙” 却存在着诸多问题。
由于科研人员对数据标准和数据管理(data stewardship)的意识不足,实施也不够到位,导致许多数据集缺乏可比性、可重复性和可重用性。就好比不同的人用不同的语言记录信息,最后大家都难以理解和利用这些信息。为了解决这一困境,2021 年美国国家微生物组数据协作组织(National Microbiome Data Collaborative,NMDC)启动了大使计划(Ambassador Program)。该计划采用社区学习模式,每年培训一批早期科研人员,让他们掌握微生物组数据管理的最佳实践方法,然后这些 “大使” 们再通过举办工作坊等活动,将这些理念传递给各自的研究社区。
为了量化这种学习模式对提高微生物组数据认知和实践经验的影响,来自洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)、劳伦斯伯克利国家实验室(Lawrence Berkeley National Laboratory)等多个机构的研究人员开展了一项研究。他们对 2023 年大使计划举办的工作坊参与者进行了调查,相关成果发表在《Scientific Reports》上。
研究人员采用的主要技术方法包括:设计了一份涵盖参与者背景、活动体验、标准化及数据管理等多方面内容的调查问卷,该问卷经劳伦斯伯克利国家实验室人类受试者委员会审查批准为豁免 IRB 协议(#394NR002),并在活动结束后由大使们向参与者发放;运用回顾性调查设计,让参与者在活动前后对相关概念的熟悉程度和重要性进行评分;利用 Microsoft Excel 进行数据整理和计算,通过 R 语言及相关软件包进行数据分析和结果可视化。
在研究结果方面:2023 年的 13 位 NMDC 大使共举办了 21 场活动,其中 15 场活动收集到了 122 名参与者的调查反馈。参与者主要来自学术机构(76.2%),涵盖各个职业阶段,研究的微生物组环境也多种多样。从活动体验来看,95% 的参与者认为活动内容有用且适合自己的知识水平,98% 的人表示学到了新东西,97% 的人认为活动材料有助于学习,98% 的人感觉自己的贡献和问题受到欢迎。
在知识提升方面,86% 的参与者表示对可发现、可访问、可互操作和可重用(Findable, Accessible, Interoperable, and Reusable,FAIR)数据原则的熟悉程度有所提高;82% 的人对现有元数据标准和标准模板的熟悉程度增加;尽管很多参与者之前就意识到数据处理标准化对数据可重用性的重要性,但活动后这一认知仍有显著提升,58% 的参与者给出了更高的评分。
此外,93% 的参与者对 NMDC 及其使命和产品的熟悉程度显著提高。在未来应用方面,99% 的参与者表示计划将 FAIR 微生物组数据、数据重用等概念融入工作中,且多数参与者对 NMDC 标准化的宏基因组生物信息学工作流程和宏基因组数据的重用表现出浓厚兴趣。
在研究结论和讨论部分,该研究表明社区学习模式对于提高微生物组研究领域对数据管理最佳实践的认识具有重要价值,“培训培训者” 模式有效地将 NMDC 的使命和产品传播给了更广泛的受众。不过,研究也存在一些局限性,如活动后调查参与度不足、依赖自我报告、回顾性调查方法存在固有缺陷等。
总体而言,NMDC 大使计划对微生物组科学意义重大,它推动了微生物组研究最佳实践方法的传播,有助于提高微生物组数据的生成和利用效率,促进科学成果的产出和创新。未来,还需要进一步完善相关工作,如扩大调查范围,以更全面地了解微生物组研究社区的需求和反馈,更好地推动微生物组研究的发展。