与生物燃料和生物产品相关的微藻Nannochloropsis oceanica CCAP849/10的基因组组装与注释

《Microbiology Resource Announcements》:Genome assembly and annotation of the biofuel- and bioproduct-relevant microalga Nannochloropsis oceanica CCAP849/10

【字体: 时间:2026年03月21日 来源:Microbiology Resource Announcements 0.6

编辑推荐:

  Nannochloropsis oceanica CCAP849/10基因组测序完成,采用Illumina HiSeq 3000平台及SPAdes组装,去除细菌污染后获得30,966,671 bp高质量基因组,N50为66,883 bp,GC含量54.2%。

  

摘要

Nannochloropsis oceanica是一种单细胞微藻,属于真眼虫门,被广泛用于工业应用。这种藻类在开放系统中生长旺盛,是多不饱和脂肪酸的丰富来源,并拥有丰富的分子工具箱,包括CRISPR/Cas9基因组编辑和转化技术。本文报告了N. oceanica CCAP849/10菌株的基因组组装结果。

公告

Nannochloropsis oceanica是一种单细胞微藻,属于真眼虫门,被用于工业应用(12)。它在开放系统中生长良好,是多不饱和脂肪酸的重要来源。此外,该藻类已经具备了一系列先进的分子技术,如CRISPR/Cas9基因组编辑、靶向基因替换和转化能力(36)。
N. oceanica CCAP849/10菌株来自英国的藻类和原生动物培养收藏中心(CCAP),该菌株是从挪威的一家养殖场分离获得的。藻类在f/2培养基中(UTEX,奥斯汀,德克萨斯州)在24°C的连续光照条件下进行培养,当培养物处于指数生长初期(4天)时被收集。细胞通过3000 × g的离心力在4°C下离心10分钟,然后用冷水冲洗两次,重复此过程。细胞随后被冷冻在液氮中。基因组DNA的提取采用了Russo等人的方法(7)。提取后的DNA按照Qiagen公司的试剂盒说明进行RNA酶处理,并使用Zymo Research公司的DNA清洁和浓缩试剂盒进行纯化。基因组DNA片段化后,使用Illumina公司的Nextera Paired-End DNA测序试剂盒进行文库构建(按照制造商的说明书操作)。文库在Illumina HiSeq 3000平台上以高输出模式进行测序,配置为2 × 150 bp的测序长度。原始的配对末端数据共包含394,373,060条读段,覆盖率为其基因组的约1,972倍。除非另有说明,所有基因组组装和分析步骤均使用默认参数。原始读段经过fastp软件(8)的质量筛选和修剪,最终得到361,046,446条读段,覆盖率为1,800倍。为避免因测序错误导致的组装问题,经过质量筛选的读段通过bbmap的“reformat.sh”工具以“samplerate=0.07”参数进行降采样,然后使用SPAdes v3.13.0软件(9)以“-k 21,33,55,77,99,127”参数进行组装。
初步组装得到的基因组总长度为34,851,168 bp,N50值为84,559 bp。使用Jellyfish和GenomeScope软件(1011)的“count”参数设置为“-m 55 -s 100M”进行k-mer频率分析,发现了一个与主要k-mer不同的低覆盖率峰值。对这些读段组装得到的contigs(n = 19,388,497 bp)进行Blast查询后,结果显示它们来源于细菌,与Muricauda ruestringensis DSM 13528最为相似(12)。去除这些来自M. ruestringensi的contigs后,得到了一个未被污染的基因组,长度为30,966,671 bp(N50 = 66,883 bp,1,567个contigs,GC含量为54.2%),这与其他公开的N. oceanica基因组结果一致。通过对Stramenopile BUSCO基因的分析,该基因组的完整性为88%(5%为片段化序列,7%缺失)。最终基因组注释使用了BRAKER2软件(13),并参考了公开的N. oceanica RNA转录本(SRR8264605和< />)进行结构注释(图1)。
图1
K-mer频率图显示了Nannochloropsis oceanica基因组的序列片段分布。图中可见多个覆盖峰值,以及一个明显破坏了预期基因组模式的不规则峰值。
图1 Nannochloropsis oceanica文库的K-mer频率谱。错误线在大约100倍覆盖率处有一个异常峰值,表明文库可能存在污染。

致谢

我们感谢Amanda Barry提供用于本项目的培养样本。同时感谢Sara Calhoun协助在Phycocosm平台上创建基因组门户。
本研究得到了美国能源部能源效率与可再生能源办公室生物能源技术办公室的支持,合同编号分别为DE-EE0008902、DE-EE0008514和DE-EE0009672。
本研究成果已获得洛斯阿拉莫斯国家实验室(LA-UR-24-20080)的公开发布许可。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号