意大利环境研究基础设施FAIR原则采纳评估:推动数字生态系统协同发展的关键一步

《Patterns》:Assessing the adoption of the FAIR principles in Italian environmental research infrastructures

【字体: 时间:2025年11月14日 来源:Patterns 7.4

编辑推荐:

  为破解环境数据“难找、难取、难互通、难再用”顽疾,Nestola 等系统调研14个意大利环境研究基础设施(RIs),揭示FAIR实施高度异质但海洋领域已现趋同,为ITINERIS HUB设计提供基准,助力欧洲开放科学云(EOSC)落地。

  
在全球气候变化、生物多样性锐减与自然灾害频发的当下,环境科学数据已成为支撑政策决策与科技创新的“新石油”。然而,数据散落各处、格式五花八门、授权条款模糊、元数据残缺不全,让研究者常常陷入“大海捞针”的尴尬:明知数据存在,却找不到、下不到、用不了。欧洲委员会2016年提出的FAIR原则(可查找Findable、可访问Accessible、可互操作Interoperable、可再用Reusable)被视为破解这一困境的金钥匙,但“理想很丰满,现实很骨感”——不同学科、不同国家、不同基础设施(RI)各自为战,FAIR落地方式千奇百怪,缺乏系统画像。意大利作为欧洲环境观测网络的关键节点,其22个国家级环境RI覆盖大气、海洋、生物圈、岩石圈等多领域,若无法厘清现状、提炼共识,势必拖累欧洲开放科学云(EOSC)的整体进程。正是在这一背景下,Nestola团队受命于意大利国家项目ITINERIS,首次对14个已具备“最低FAIR就绪水平”的环境RI开展“体检”,旨在绘制一份可追踪、可复刻、可推广的FAIR实践地图,为国家枢纽ITINERIS HUB的设计提供硬核证据。
研究团队采用混合方法学“三步走”:①在线问卷覆盖22个RI,收集元数据、语义资源及其他数字对象(DO)的管理现状;②一对一访谈19位RI的FAIR负责人,澄清模糊信息并补充遗漏细节;③系统审查14个RI的官方网站、数据门户、数据管理计划(DMP)及API文档,验证并标准化结果。样本队列即意大利境内所有参与ITINERIS项目的环境RI,无额外临床队列。
Findability(可查找性)
所有RI一致采用DOI作为持久标识符(PID),其中11家同时启用UUID、ORCID、ROR等多类型PID,实现人员、机构、样品、资助号的精准捆绑。元数据模式呈现“一超多强”:ISO 19115/19139以11家用户成为空间 temporal 数据描述“通用语”,NetCDF CF公约在大气与海洋RI中高度重叠,显示跨域趋同。11家RI优先将数据注册到自建的“RI数据门户”或“元数据目录”,同时6家把副本推送至EUDAT B2FIND,3家海洋RI共同选择SeaDataNet、EMODNet等海洋专用平台,形成“海洋数据发现共同体”。
Accessibility(可访问性)
传输协议层面,HTTPS/HTTP实现100%覆盖;JERICO与SMINO额外保留FTP供大文件批量下载;SMINO更引入Ntrip协议实时播发GNSS差分数据,满足地震监测毫秒级需求。认证授权方面,仅ACTRIS、Eurofleets、JERICO对数据下载强制CAS单点登录,上传功能则全部RI均需认证,兼顾开放与合规。长期可访问性堪忧:仅7家RI在DMP中明确写入元数据 longevity 计划,半数机构尚未制定元数据“身后事”。
Interoperability(可互操作性)
元数据格式呈现“双峰”格局:JSON与RDF/XML/Turtle各被9家RI采纳,其中4家同时部署两种格式以实现“轻量级+语义级”双重接口。数据格式却出现“33国演义”:NetCDF以9家用户成为海洋—大气“最大公约数”,但生物圈RI IBISBA与岩石圈RI SMINO各自带来9种独占格式,导致生物数据互操作鸿沟显著。语义制品(SA)方面,6家RI选用词汇表或地名表,4家自建本体,5家(ACTRIS、ICOS、LifeWatch、eLTER、AnaEE)兼具“作者+策展人”双重身份,将自产本体提交至NERC Vocabulary Server或EcoPortal,供全社区复用。
Reusability(可再用性)
授权条款呈“CC一家亲”:11家RI对元数据选用Creative Commons(CC BY、CC0或CC BY-NC),数据则额外出现CC BY-SA、ODC PDDL、ODC-ODbL及GPL、AGPL等开源许可,软件与数据库实现“应开尽开”。然而,元数据缺许可证的情况仍零星存在,提示“FAIR≠自动开放”。
讨论指出,FAIR实践的多样性受学科需求、技术成熟度与资助框架三重驱动:海洋RI因长期参与SeaDataNet等跨国项目,较早接受NetCDF CF与DOI“套餐”,形成路径依赖;生物圈RI面对“从遥感影像到宏基因组”的极端异构数据,只能“各显神通”,导致格式碎片化。作者呼吁:① reuse before rebuild,优先复用已有方案;② 建立跨RI的“FAIR决策白皮书”,记录选型动因,避免重复踩坑;③ 由Go FAIR、RDA等组织牵头,推广FAIR Implementation Profile(FIP)模板,实现技术路线“对齐”;④ 持续资助数据管家与IT专家培训,让“幕后英雄”成为FAIR收敛的推手。
这项研究首次在国家尺度上为环境RI的FAIR成熟度“拍CT”,不仅直接指导意大利ITINERIS HUB的架构选型,也为欧洲乃至全球环境领域提供了可复制的评估框架。正如文中所言,只有当FAIR实践从“百家争鸣”走向“和而不同”,环境数据才能真正跨越学科与国界,服务于碳中和、生物多样性保护等全球议程。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号