从日本岐阜县的蜂产品中分离出的Lichenicola spp. GTC18330和18331的完整基因组序列
《Microbiology Resource Announcements》:Complete genome sequences of Lichenicola spp. GTC18330 and 18331 isolated from bee products in Gifu, Japan
编辑推荐:
完成日本歧阜蜂产品中Lichenicola菌株GTC18330和18331的全基因组测序,均为单环染色体约3633kbp,GC67%,含3281-3279个CDS,无CRISPRs。测序结合牛津纳米孔长读和MGI短读,Unicycler/Flye组装,CheckM验证显示100%完整度,0%污染。
摘要
我们报告了从日本岐阜地区的蜂产品中分离出的Lichenicola菌株GTC18330和GTC18331的完整基因组序列。这些基因组由环状染色体组成,其长度分别为3,633,834 bp(GTC18330)和3,633,837 bp(GTC18331)。
公告
Lichenicola属菌属于Acetobacteraceae科,通常从环境中分离得到(参考文献[1]–[3])。在本研究中,菌株GTC18330和GTC18331是从蜂粮(发酵的花粉)和蜂蜜中分离出来的,具体方法参考了Moonmangmee等人的研究并进行了适当修改(参考文献[4])。简要来说,将每个样本1克接种到含有0.5% d-山梨糖醇、0.5% d-甘露糖醇、0.1%酵母提取物、0.1%多肽、0.03%环己亚胺和1 M葡萄糖酸(pH 4.0)的富集培养基中,然后在30°C下培养7天。培养物被涂布在含有相同培养基的琼脂平板上,并添加了1.5%琼脂和3 mg/100 mL溴甲酚紫。在30°C下培养3天后,选取黄色菌落进行进一步实验。
使用NucleoBond HMW DNA试剂盒(MACHEREY-NAGEL,德国)从沉淀的细胞中提取基因组DNA。基因组测序分别采用PromethION 2i(Oxford Nanopore Technologies [ONT],英国牛津)进行长读长测序,以及DNBSEQ(MGI Tech Co., Ltd.,中国深圳)进行短读长测序(参考文献[5]–[7])。两种平台使用相同的DNA提取物。长读长测序使用Native Barcoding Kit(SQK-NBD114-24;ONT)构建文库,且不进行DNA片段剪切。使用Short Read Eliminator XS试剂盒(Pacific Biosciences of California, Inc.,美国门洛帕克)去除小DNA片段。测序在PromethION 2i(ONT)平台上进行,流式细胞仪型号为FLO-PRO114M。碱基 calling使用Dorado v.7.2.14(超高精度模式)完成,原始读长数据通过NanoFilt v.2.7.1进行修剪和质量过滤,参数设置为“-l 1000 -q 10 --headcrop 50”。对于短读长数据,使用MGIEasy FS DNA Library Prep Set(MGI Tech)构建文库,并在DNBSEQ-G400平台上进行2 × 150 bp的双端测序。读长数据使用fastp v0.20.1处理,参数设置为“-q 30 -n 20 -t 1 -T 1”。短读长的质量评估使用fastp(参考文献[9]),长读长的质量评估使用NanoPlot v1.32.1(参考文献[9])。GTC18331的长读长数据使用Unicycler v.0.4.8进行组装,短读长数据(超过95.4%的碱基具有Q30质量)也使用Unicycler v.0.4.8组装;GTC18330的长读长数据使用Flye v.2.9组装,短读长数据(超过95.7%的碱基具有Q30质量)同样使用Flye v.2.9组装。两种组装工具均使用默认参数。Unicycler和Flye自动完成了基因组的环化处理和旋转。contig图使用Bandage v0.8.1可视化,短读长的分类完整性使用Blobtools v1.0确认。基因组注释使用DDBJ Fast Annotation and Submission Tool(DFAST)完成(参考文献[14])。基因组组装顺序调整为正向链上的dnaA基因起始。
表1
来自日本岐阜地区蜂产品的Lichenicola菌株的完整基因组序列信息
| 参数 |
菌株名称 |
| Lichenicola sp. |
GTC18330 |
Lichenicola sp. |
GTC18331 |
| DNBSEQ测序 |
a |
|
| 读长数量 |
6,54,368 |
10,515,948 |
| 基因组大小(kb) |
1,013,155 |
1,577,392 |
| 平均覆盖度(×) |
278.8 |
434.1 |
| DRA访问号 |
DRR791594 |
DRR791596 |
< />
| a |
|
| 读长数量 |
233,991 |
280,071 |
| 基因组大小(kb) |
695,787 |
905,027 |
| 平均读长(bp) |
2,974 |
3,231 |
| 平均覆盖度(×) |
191.5 |
249.1 |
< />
| 5,793.0 |
5,377.0 |
DRR访问号 |
DRR791595 |
DRR791597 |
< />
|
|
< />
| 3,633,834 |
3,633,837 |
< />
100.0 |
100.0 |
|
< />
0.0 |
0.0 |
< />
< />
< />
AP044853
AP045015
< />
<3,633,834
<3,633,837
< />
<67.0
<67.0
编码序列数量 |
<3,281
<3,279
rRNA数量
<9
<9
tRNA数量
<55
<55
CRISPR数量
<0
<0
a DRA(Data Release Archive)和DDBJ(Database of DNA Sequences)序列存档。
DFAST(DDBJ Fast Annotation and Submission Tool)。
基因组污染率使用CheckM v1.2.2确定。
致谢
我们感谢畑崎京子(Kyoko Hatazaki)、片野明子(Akiko Katano)和长泽步(Ayako Nagasawa)提供的技术支持。
作者声明本研究得到了API有限公司(API Co., Ltd.)的研究资助。
资助方对研究设计、数据收集与分析、发表决定或手稿准备没有任何影响。