编辑推荐:
在化学研究中,为实现科研成果的可持续性与透明性,研究人员开展了 “Linking Research Data with Physically Preserved Research Materials in Chemistry” 主题研究。结果构建出结合数据与物质样本的 FAIR-FAR 样本概念及基础设施,这有助于推动化学领域更可持续的科研工作。
在当今化学研究领域,随着科研的不断深入,可持续性和透明性成为了衡量科研效率的重要标准。自 FAIR 数据原则(即数据应具备可发现性 Findable、可访问性 Accessible、可互操作性 Interoperable 和可重用性 Reusable )发布以来,越来越多的科学家和相关利益方积极支持各学科生成和提供 FAIR 数据。在化学和材料科学领域,众多举措也致力于推动 FAIR 数据的提供和实施。然而,仅依靠 FAIR 数据并不足以使化学成为一门可持续发展的学科,还需要一个涵盖材料保存的综合概念。
目前,在合成化学领域,虽然数据的 FAIR 化备受关注,但对于反应产物等物理材料的处理却存在不足。许多化学物质在反应后,其产物若稳定,本可作为研究成果的实物证据,用于后续研究,如实验重复、反应应用、分析测试等,但却缺乏有效的收集、存储和共享机制。在其他学科,如地球科学、微生物学等,样本的收集和存档已成为科研工作的重要环节,且一些样本库正努力使样本符合 FAIR 原则。而在化学领域,虽然全球有少数中心在收集和存储化学物质,但大多是出于医学或制药目的,且不提供开放的通用后续使用。
为了解决这些问题,德国卡尔斯鲁厄理工学院(Karlsruhe Institute of Technology)的研究人员开展了一项旨在建立可持续化学研究模式的探索。他们致力于收集、存档和再利用化学研究的物理成果,并将其与现有的化学研究数据基础设施相连接。
研究人员提出了 “FAIR-FAR 样本” 概念,即通过扩展 FAIR(元)数据原则,引入针对化学样本等物理对象的可持续访问概念。具体而言,样本的元数据需满足 FAIR 原则,成为可发现、可访问、可互操作和可重用的样本数字对象;同时,样本需在材料档案库中注册和存储,满足可发现、可访问和物理可重用性(Findable, Accessible, Reusable,简称 FAR),成为 FAR 样本 。
在实现这一概念的过程中,研究人员利用了 Chemotion 存储库和分子档案库(Molecule Archive)。Chemotion 存储库是一个与化学相关的研究数据存储库,可用于上传和管理化学研究数据,遵循开放访问政策,是德国 NFDI4Chem 战略的一部分。分子档案库则用于化学物质的注册、验证和收集,保存物质以供文档记录和再利用。研究人员通过特定协议,将 Chemotion 存储库中样本的虚拟表示与分子档案库中的物理样本进行匹配,使样本可通过 InChI 键等进行搜索和关联。
研究结果表明,该基础设施已在卡尔斯鲁厄理工学院建立并应用于多种化学化合物的研究,涵盖有机化学、无机化合物和金属有机框架(MOFs)等。科学家们对该基础设施进行了测试,验证了其在数据和样本的数字化及物理转移和存储方面的可行性和可靠性。
从样本元数据的角度来看,其具备良好的可发现性,通过 Chemotion 存储库的图形用户界面(GUI)和应用程序编程接口(API),可基于样本描述、化学结构等进行搜索;可访问性方面,通过 OAI-PMH 协议,用户可获取不同格式的样本元数据记录;互操作性上,样本元数据包含标准化的分子描述符和领域相关的本体术语;可重用性上,元数据详细描述了样本的成分、属性、分析数据和合成来源,为化学实验的重现提供了关键信息。
对于物理样本本身,研究人员通过标记和数据库编目使其可发现;通过存储库界面和联系表单,依据材料转移协议(MTA)决定样本的访问和使用,实现可访问性;通过质量保证措施、框架协议和咨询支持,保障样本的可重用性。
然而,该研究也面临一些挑战。例如,不稳定的金属有机化合物难以作为公开可访问和可重用的样本;目前方法仅适用于具有明确化学结构的样本,混合物或天然提取物尚未纳入;对于一些复杂化合物类,如表面锚定金属有机框架(SURMOFs),基础设施的适用性有待提高;部分样本因缺乏独特化学结构描述,搜索效率受限;样本的再利用受资源限制和利益权衡影响;样本的提供需要时间准备和法律协议支持。
尽管存在挑战,但这项研究具有重要意义。它为化学研究提供了一种更可持续的工作模式,将 FAIR 数据与物理样本相结合,增强了研究成果的透明度和可信度。若在研究成果发表前提交样本,可直接将样本存档与发表相关联,提升研究的影响力。同时,样本的提供也为科学家带来了合作和发表的机会,促进了科学研究的发展。
研究人员为开展这项研究,主要运用了以下关键技术方法:一是利用开源软件构建基础设施,Chemotion 存储库和分子档案库软件基于 Chemotion ELN 开发,相关代码可从 GitHub 和 Zenodo 获取;二是制定数据提交流程,在提交数据至 Chemotion 存储库时,用户需提供样本信息,系统自动生成样本元数据,研究数据需按学科标准准备;三是建立法律框架,通过制定标准材料转移协议(MTA),规范样本共享各方的权利和义务。
综上所述,该研究通过提出 FAIR-FAR 样本概念,构建相关基础设施,为化学研究的可持续发展提供了新的思路和方法。尽管面临挑战,但在推动化学领域的科研进步和成果共享方面具有巨大潜力,有望为未来化学研究开辟新的发展方向。