从韩国安城一处稻田的土壤样本中分离出的Nocardioides菌株MAHUQ-72的基因组序列草图
《Microbiology Resource Announcements》:Draft genome sequence of Nocardioides strain MAHUQ-72 isolated from soil sample of a rice field located in Anseong, South Korea
【字体:
大
中
小
】
时间:2025年11月26日
来源:Microbiology Resource Announcements 0.6
编辑推荐:
本研究解析了韩国安城水稻田分离得到的Nocardioides MAHUQ-72菌株的draft基因组序列,基因组长度4732460 bp,含23条contig,预测编码蛋白基因4555个,与近缘种Nocardioides koreensis的ani值为84.2%,完整度达99.47%。
摘要
本研究报道了从韩国安城一个稻田土壤样本中分离出的细菌菌株Nocardioides MAHUQ-72的基因组序列草图。该基因组由4,732,459个碱基对组成,组装成23个 contigs,编码4,555个预测的蛋白质编码基因。
公告
Nocardioides 属属于
Nocardioidaceae 科,隶属于
Actinomycetota 门,最初由Prauser(
1 )描述。目前该属包含171个已正式发表的物种(
2 ),这些物种来自不同的环境,包括土壤、水、植物根系、油页岩柱、草地、沙漠、森林、蒲公英、污泥和洞穴(
3 )。在对稻田细菌多样性的研究中,分离出了一种新的
Nocardioides 菌株,即MAHUQ-72菌株,本研究展示了其基因组序列草图。
MAHUQ-72菌株是从韩国安城(纬度37° 00′ 31″,经度127° 21′ 58″)的一个稻田土壤样本中分离得到的(采集日期:2020.10.20)。将1克土壤样本悬浮在9毫升无菌0.85%(重量/体积)NaCl溶液中,然后连续稀释至10
?6 浓度,并将100微升稀释液涂布在R2A琼脂平板上(
4 )。随后将平板置于30°C培养箱中培养3天。通过多次划线培养在新鲜的R2A琼脂平板上纯化单菌落。MAHUQ-72菌株已在中国普通微生物菌种保藏中心(CGMCC)注册,注册号为CGMCC 1.19066。基因组DNA是从在R2A培养基中培养24小时的细菌中提取的,使用的是Solg Genomic DNA Prep试剂盒(Solgent,韩国)。利用AMPure XP磁珠对DNA片段进行大小筛选,以分离出约200–300个碱基对范围的片段。使用Nextera XT DNA Library Prep Kit(Illumina,美国圣地亚哥)制备测序文库。测序工作采用Illumina HiSeq 3000平台进行,读取长度为2×150 bp,遵循制造商提供的标准流程。使用Illumina的bcl2fastq软件版本2.20.0对原始读取数据进行去重并转换为FASTQ格式,处理过程使用了Trimmomatic版本0.38(
5 )。基因组序列使用SOAPdenovo v2.04组装器(
6 )组装,并通过NCBI Prokaryotic Genome Annotation Pipeline版本6.3(
7 – 9 )进行注释。质量分析使用CheckM版本1.2.4(
10 )完成。菌株的分类鉴定通过Type (Strain) Genome Server(
https://tygs.dsmz.de )的全基因组分析完成。除非另有说明,所有软件均使用默认参数。使用基因组间距离生物信息学工具(
11 )
in silico 计算DNA-DNA杂交(isDDH)值。为了估计MAHUQ-72与最近缘标准菌株的亲缘关系,计算了基于BLAST的平均核苷酸同一性(ANI)(
12 )。与MAHUQ-72基因组最匹配的标准菌株是
Nocardioides koreensis JCM 16022(登录号
GCA_039531775.1 ),其isDDH和ANI值分别为27.6%和84.2%。
MAHUQ-72菌株的基因组长度为4,732,459 bp,GC含量为72.5%。基因组组装包含23个contigs,覆盖率为83×。共预测出4,620个基因,其中4,555个为蛋白质编码基因。基因组特征的详细信息见
表1 。
表1 Nocardioides MAHUQ-72菌株的基因组特征
参数
结果
来源描述
位置
韩国安城
时间
2020年
类型
稻田土壤样本
测序总结
基因组总长度
4,732,459 bp
覆盖率
83×
GC含量
72.5%
读取数量
2,982,010
组装报告
contigs数量
23
Contig L 50 长度
5
Contig N 50 长度
453.6 kb
基因组长度
4.7 Mb
注释报告
基因总数
4,620
CDS总数
4,566
含蛋白质的CDS数量
4,555
ncRNA数量
3
tRNA数量
48
质量分析
完整性
99.47%
污染率
1.67%
致谢
特别感谢中国科学研究院微生物研究所(WDCM,北京100101)对MAHUQ-72菌株基因组测序工作的支持。
Md. Amdadul Huq:概念设计、数据分析、初稿撰写;Shahina Akter:数据分析与修订;Md. Shahidul Islam:数据分析与修订;Md. Shahedur Rahman:数据分析与修订。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号