基于成像流式细胞术的北海浮游植物长期生物多样性评估数据集

《Scientific Data》:Advancing long-term phytoplankton biodiversity assessment in the North Sea using an imaging approach

【字体: 时间:2025年12月17日 来源:Scientific Data 6.9

编辑推荐:

  为解决北海浮游植物长期监测数据在时空分辨率和分类精度上的不足,研究人员利用FlowCam成像技术,发布了覆盖7.5年、包含138个生物类群的高质量数据集。该研究通过优化采样与实验室流程,并整合卷积神经网络(CNN)构建半自动化数据处理管道,显著提升了数据处理的效率与准确性。该数据集为评估海洋生态系统健康、研究气候变化影响及有害藻华(HABs)提供了宝贵的资源。

  
在浩瀚的海洋中,浮游植物虽然个体微小,却是整个生态系统运转的基石。它们贡献了全球近一半的净初级生产力,是海洋食物网的起点,更是地球生物地球化学循环和气候调节的关键参与者。由于浮游植物具有高丰度和短世代周期的特点,它们对环境变化极为敏感,其群落结构和丰度的变化会通过营养级联效应影响整个生态系统的功能。因此,浮游植物被欧盟《海洋战略框架指令》(MSFD)和《水框架指令》(WFD)等法规框架视为评估水质、食物网和远洋栖息地健康状况的关键指标。
然而,尽管浮游植物监测至关重要,但长期以来,高质量的长期监测数据集却十分稀缺。许多监测项目往往是短期的、基于特定项目的,导致数据在时间上存在断层,或者在空间和分类学分辨率上不足。对于像北海这样受到人类活动(如近海工业、航运、富营养化和气候变化)严重影响的区域,缺乏高分辨率、长期连续的浮游植物数据,极大地限制了我们准确评估生态系统变化、预测有害藻华(HABs)以及制定有效管理策略的能力。
为了填补这一空白,来自法兰德斯海洋研究所(VLIZ)和根特大学的研究团队在《Scientific Data》上发表了一项重要研究。他们利用FlowCam成像技术,对北海比利时海域(BPNS)的浮游植物进行了长达7.5年的持续监测,并构建了一个高时空分辨率、高分类学精度的生物多样性数据集。该研究不仅扩展了此前发布的数据,还通过优化采样与实验室流程,并整合深度学习算法,建立了一套更稳健、更高效的数据处理框架,为海洋生态学研究提供了宝贵的资源。
关键技术方法
为了构建这一高质量的长期数据集,研究人员建立了一套从采样到数据发布的完整技术流程。首先,他们利用研究船“Simon Stevin”号,在北海比利时海域的9个近岸站点(每月)和8个离岸站点(每季度)进行定期采样。采集的水样通过55微米网孔的浮游生物网过滤,并使用卢戈氏碘液固定。随后,在实验室中,使用FlowCam VS-4设备对样品进行成像分析,该设备结合了流式细胞术和显微成像技术,能够自动、高通量地获取浮游植物颗粒的图像。为了处理每年产生的数十万张图像,研究团队开发了一套半自动化的数据处理管道。该管道利用卷积神经网络(CNN)对图像进行初步分类,然后由科学家进行人工验证和修正,最终将数据聚合为每个样品的分类群计数和密度,并发布在多个开放数据平台。
研究结果
1. 采样与实验室流程的优化
研究团队详细描述了自2017年5月以来的采样策略,涵盖了9个近岸站点和8个离岸站点,形成了高空间覆盖度的监测网络。在实验室处理方面,他们优化了FlowCam的操作参数,包括使用300微米的一次性流动池、4倍物镜,并设定了特定的流速和帧率,以确保在30分钟内完成一个样品的分析,同时获得最高的成像效率。此外,他们还调整了卢戈氏碘液的固定浓度,以更好地保护某些类群(如甲藻)的形态特征,并制定了严格的样品稀释和重复运行标准,以控制技术误差。
2. 半自动化数据处理管道的建立
面对海量的图像数据,研究团队建立了一个集成的数据处理管道。该管道首先从FlowCam的原始输出中提取图像和元数据,并将其上传至内部的BioSense MongoDB数据库。随后,利用基于Xception架构的卷积神经网络(CNN)对图像进行初步分类。该模型经过超过200万张人工验证图像的训练,能够识别95个FlowCam类群,前两名准确率超过93%。最后,所有模型预测的图像均由科学家进行人工检查和修正,确保了数据的准确性。
3. 数据集的分类学修订与扩展
为了提升数据集的分类学精度和一致性,研究团队对历史数据进行了全面的分类学修订。他们将部分高级分类群拆分为更精细的属或种水平类群,同时为形态特征不明显的类群引入了更高级别的分类标签。经过修订,数据集涵盖的生物类群从55个增加至138个,包括76个硅藻类群、17个甲藻类群、16个纤毛虫类群等。所有分类群名称均与世界海洋物种名录(WoRMS)的物种分类学主干进行了匹配,确保了数据的标准化和互操作性。
4. 数据记录与可用性
经过验证的生物多样性数据以达尔文核心档案(DwC-A)格式发布在多个开放数据平台,包括欧洲海洋生物地理信息系统(EurOBIS)、全球海洋生物地理信息系统(OBIS)和海洋数据档案(MDA)。此外,包含超过200万张图像的完整注释图像库以及用于CNN训练的数据集也已在Zenodo等平台公开,为其他研究人员提供了宝贵的资源。
5. 技术验证与使用说明
研究团队对数据质量进行了严格验证,并指出了使用数据时需要注意的局限性。例如,对于某些容易形成水华的类群(如根管藻Rhizosolenia和Bellerochea),在实验室处理过程中可能因细胞堵塞流动池而导致丰度估算出现偏差。此外,由于流动池的宽度限制,细胞或群体尺寸超过300微米的类群(如夜光藻Noctiluca和Phaeocystis)的丰度估算也可能不准确。研究人员建议,在分析这些类群时,应谨慎使用密度数据,或转而使用不受稀释因子影响的丰度数据。
结论与讨论
这项研究通过整合FlowCam成像技术、优化的实验室流程和基于深度学习的半自动化数据处理管道,成功构建了北海比利时海域一个长达7.5年、高时空分辨率的浮游植物生物多样性数据集。该数据集不仅显著提升了分类学精度,还通过开放数据政策,为全球海洋生态学研究提供了宝贵的资源。
该数据集的重要意义在于,它为评估海洋生态系统健康、研究气候变化对浮游植物群落的影响、监测有害藻华(HABs)的发生以及验证生态模型提供了坚实的数据基础。同时,研究团队开发的半自动化数据处理管道,展示了如何利用人工智能技术高效处理海量生物成像数据,为未来的环境监测项目提供了可借鉴的范例。尽管存在一些技术局限性,但通过明确的数据使用说明,研究人员能够更准确地利用这些数据,从而推动我们对海洋生态系统动态的深入理解。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号