编辑推荐:
研究人员对尖刺拟菱形藻(Scrippsiella acuminata)进行全转录组分析,获多组学数据,为研究甲藻生命史及藻华机制提供依据。
在广袤无垠的海洋世界里,藻类扮演着极为重要的角色。甲藻(Dinoflagellates)作为单细胞真核生物中的一员,在海洋生态系统中占据着独特的地位。它们不仅是海洋中重要的初级生产者,对全球碳固定、元素循环和氧气产生贡献巨大,还与其他生物存在着共生或寄生关系,比如与造礁珊瑚和无脊椎动物的互利共生。然而,部分甲藻也因其引发的有害藻华(HABs)现象而备受关注。全球约 2300 种甲藻中,近 200 种可导致约 75% 的藻华事件,这些藻华不仅会让海水变色、造成氧气耗尽和黏液产生,还会通过食物链影响人类健康,其中毒性甲藻能直接毒害动物,非毒性甲藻则以高生物量破坏沿海生态平衡 。
尖刺拟菱形藻(Scrippsiella acuminata,曾用名 Scrippsiella trochoidea)是一种全球性分布的甲藻,常常在世界各地形成密集的藻华,对贝类幼虫具有快速致死作用。由于其在实验室和野外都易产生休眠孢囊(Resting cysts),常被选为研究甲藻生命史的模式物种。以往研究多采用 RNA-Seq 技术,但由于该物种基因组结构复杂,短读长测序难以准确捕获完整转录本,限制了对其生理机制的深入理解。为了突破这一困境,中国科学院海洋研究所的研究人员开展了一项关于尖刺拟菱形藻全转录组的研究,相关成果发表在《Scientific Data》杂志上。
为完成此项研究,研究人员运用了多种关键技术方法。首先是单分子实时(SMRT)测序技术,这一技术能够获取长读长序列,从而弥补传统测序技术的不足。在实验过程中,研究人员对不同生长阶段的营养细胞(指数生长期和稳定生长期)和休眠孢囊进行样本采集,接着提取总 RNA 并构建测序文库,最后在 PacBio 测序平台上进行全转录组测序。测序后的数据经过一系列严格的处理流程,包括利用 SMRT Link v10.0 软件处理原始数据、使用多种工具去除引物和 poly(A)尾、通过聚类算法识别高质量转录本等,还运用了多种生物信息学软件对数据进行功能注释和结构分析。
下面来详细看看研究结果。
- 测序数据概况:研究共产生 51.44 Gb 的高质量 SMRT 测序数据,经处理后得到 596,485 条环形一致序列(CCS),平均长度为 3,726 bp。其中 97.2% 被识别为全长非嵌合(FLNC) reads,聚类、纠错和去冗余后,最终获得 226,117 条非冗余 FLNC reads,其 N50 长度达 3,696 bp。通过 BUSCO 分析评估转录组数据完整性,发现 303 个保守真核直系同源基因中有 160 个(52.8%)被识别,113 个(37.3%)完全匹配。
- 功能注释:研究人员将所有 FLNCs 与多个公共数据库进行比对注释,结果显示 130,134 条(57.55%)FLNCs 在至少一个数据库中有匹配序列。在 NR 注释中,32.19% 的同源 FLNCs 与极地原甲藻(Polarella glacialis)匹配;KEGG 数据库分类表明,非冗余 FLNCs 涉及细胞过程、环境信息处理、遗传信息处理、代谢和生物系统等多个功能组,其中代谢相关的基因最多,占 58.14%。GO 注释将 48,908 条 FLNCs 分配到生物过程、细胞成分和分子功能三个主要类别,进一步细分后发现参与 “细胞过程” 和 “代谢过程” 的基因比例较高;KOG 注释得到 25 个类别的 51,800 个推定蛋白质,其中 “一般功能预测” 类别最多。
- 结构分析:在简单序列重复(SSR)结构分析中,研究人员发现单核苷酸重复(42,038 个,62.55%)占比最多,其次是三核苷酸重复(17,724 个,26.37%)和二核苷酸重复(5,174 个,7.70%) 。通过多种软件预测,研究人员共鉴定出 116,417 条蛋白质编码序列(CDS)、550 个推定转录因子(TF)成员(分属 19 个 TF 家族,其中半胱氨酸和丝氨酸富集结构域(CSD)家族和 C3H 型锌指(C3H)家族成员较多)以及 78,393 条长链非编码 RNA(lncRNA)。
这项研究首次获得了甲藻门胸甲藻科的全长转录组数据集,为后续该目物种的基因组注释奠定了坚实基础。研究所得数据集对推进甲藻生命史研究意义重大,有助于深入解析尖刺拟菱形藻在沿海环境中形成有害藻华的分子机制,为预测和防控有害藻华提供了关键的理论依据,在海洋生态保护和资源管理方面具有重要的潜在应用价值。