
-
生物通官微
陪你抓住生命科技
跳动的脉搏
印度洋-太平洋汇聚区多毛类综合数据集:物种分布、DNA条形码与功能性状的整合研究
【字体: 大 中 小 】 时间:2025年06月08日 来源:Scientific Data 5.8
编辑推荐:
本研究针对印度洋-太平洋汇聚区(IPC)多毛类生物多样性数据分散、验证不足的问题,由中国科学院海洋研究所团队构建了全球首个整合物种分布、DNA条形码(COI/16S/18S)和13类功能性状的综合数据库。该研究收录39,310条分布记录(覆盖2,831物种)、7,052条基因序列(含35.1%新贡献线粒体基因组)及12,000项功能性状数据(90%为新补充),为热带海洋生物地理学、生态功能演化和保护生物学研究提供了里程碑式资源。
印度洋-太平洋汇聚区(IPC)作为全球海洋生物多样性热点,其多毛类动物因兼具生态指示价值与进化研究潜力而备受关注。然而,该区域长期面临物种记录碎片化、分子数据覆盖率低(仅29%物种有DNA条形码)、功能性状数据库缺失三大瓶颈。传统依赖GBIF/OBIS等公共平台的数据存在验证不足、分类冲突等问题,严重制约了生物地理格局解析和生态系统功能研究。
针对这一挑战,中国科学院海洋研究所联合青岛海洋科学与技术试点国家实验室的研究团队,通过整合39,310条跨248年(1776-2024)的分布记录(含13%文献独家数据)、7,052条分子序列(含154个线粒体基因组)及12,000项功能性状测量值,构建了IPC区域迄今最完整的多毛类综合数据库。该成果以《Comprehensive Dataset for Polychaetes in the IPC: Species Distribution, DNA Barcodes, and Functional Traits》为题发表于《Scientific Data》。
研究采用三大关键技术路线:1) 地理信息标准化处理(通过WoRMS分类校验和四阶小数坐标校准);2) 多源DNA条形码整合(结合Sanger测序与WGS组装,使用GetOrganelle/MitoZ13,14
进行线粒体基因组注释);3) 功能性状系统归类(基于Polychaete Traits Database等12个权威来源,建立形态-生理-生活史-行为四维矩阵)。
物种分布数据
通过分析39,310条记录发现:澳大利亚贡献了61.4%的采样事件,1991-2010年为采样高峰期(12,089次)。物种数TOP5科为 Syllidae(329种)、Nereididae(220种)和Terebellidae(215种)。

DNA条形码数据
新增55个线粒体基因组(占总数35.1%),COI基因覆盖20.1%物种(3,973条),Nereididae和Spionidae为测序最丰富科。

功能性状数据
温度耐受性(12,000条记录中占比最高)与分支结构等4个性状构成核心维度,而种群产卵频率等3个性状数据稀缺。

该研究首次实现了IPC多毛类"分布-基因-功能"三维数据的系统整合,其三大突破在于:1) 解决分类学争议(通过分子证据规避形态分类冲突);2) 建立功能性状量化标准(开发13类性状编码体系);3) 提供进化生态学新范式(如通过线粒体基因组解析热带物种适应机制)。数据库将持续更新并应用于珊瑚礁保护、深海采矿生态评估等场景,为理解生物多样性维持机制提供关键基础设施。
生物通微信公众号
知名企业招聘