从韩国安城一处稻田的土壤样本中分离出的Nocardioides菌株MAHUQ-72的基因组序列草图

《Microbiology Resource Announcements》:Draft genome sequence of Nocardioides strain MAHUQ-72 isolated from soil sample of a rice field located in Anseong, South Korea

【字体: 时间:2025年11月26日 来源:Microbiology Resource Announcements 0.6

编辑推荐:

  本研究解析了韩国安城水稻田分离得到的Nocardioides MAHUQ-72菌株的draft基因组序列,基因组长度4732460 bp,含23条contig,预测编码蛋白基因4555个,与近缘种Nocardioides koreensis的ani值为84.2%,完整度达99.47%。

  

摘要

本研究报道了从韩国安城一个稻田土壤样本中分离出的细菌菌株Nocardioides MAHUQ-72的基因组序列草图。该基因组由4,732,459个碱基对组成,组装成23个 contigs,编码4,555个预测的蛋白质编码基因。

公告

Nocardioides属属于Nocardioidaceae科,隶属于Actinomycetota门,最初由Prauser(1)描述。目前该属包含171个已正式发表的物种(2),这些物种来自不同的环境,包括土壤、水、植物根系、油页岩柱、草地、沙漠、森林、蒲公英、污泥和洞穴(3)。在对稻田细菌多样性的研究中,分离出了一种新的Nocardioides菌株,即MAHUQ-72菌株,本研究展示了其基因组序列草图。
MAHUQ-72菌株是从韩国安城(纬度37° 00′ 31″,经度127° 21′ 58″)的一个稻田土壤样本中分离得到的(采集日期:2020.10.20)。将1克土壤样本悬浮在9毫升无菌0.85%(重量/体积)NaCl溶液中,然后连续稀释至10?6浓度,并将100微升稀释液涂布在R2A琼脂平板上(4)。随后将平板置于30°C培养箱中培养3天。通过多次划线培养在新鲜的R2A琼脂平板上纯化单菌落。MAHUQ-72菌株已在中国普通微生物菌种保藏中心(CGMCC)注册,注册号为CGMCC 1.19066。基因组DNA是从在R2A培养基中培养24小时的细菌中提取的,使用的是Solg Genomic DNA Prep试剂盒(Solgent,韩国)。利用AMPure XP磁珠对DNA片段进行大小筛选,以分离出约200–300个碱基对范围的片段。使用Nextera XT DNA Library Prep Kit(Illumina,美国圣地亚哥)制备测序文库。测序工作采用Illumina HiSeq 3000平台进行,读取长度为2×150 bp,遵循制造商提供的标准流程。使用Illumina的bcl2fastq软件版本2.20.0对原始读取数据进行去重并转换为FASTQ格式,处理过程使用了Trimmomatic版本0.38(5)。基因组序列使用SOAPdenovo v2.04组装器(6)组装,并通过NCBI Prokaryotic Genome Annotation Pipeline版本6.3(79)进行注释。质量分析使用CheckM版本1.2.4(10)完成。菌株的分类鉴定通过Type (Strain) Genome Server(https://tygs.dsmz.de)的全基因组分析完成。除非另有说明,所有软件均使用默认参数。使用基因组间距离生物信息学工具(11in silico计算DNA-DNA杂交(isDDH)值。为了估计MAHUQ-72与最近缘标准菌株的亲缘关系,计算了基于BLAST的平均核苷酸同一性(ANI)(12)。与MAHUQ-72基因组最匹配的标准菌株是Nocardioides koreensis JCM 16022(登录号GCA_039531775.1),其isDDH和ANI值分别为27.6%和84.2%。
MAHUQ-72菌株的基因组长度为4,732,459 bp,GC含量为72.5%。基因组组装包含23个contigs,覆盖率为83×。共预测出4,620个基因,其中4,555个为蛋白质编码基因。基因组特征的详细信息见表1
表1
表1Nocardioides MAHUQ-72菌株的基因组特征
参数 结果
来源描述
位置 韩国安城
时间 2020年
类型 稻田土壤样本
测序总结
基因组总长度 4,732,459 bp
覆盖率 83×
GC含量 72.5%
读取数量 2,982,010
组装报告
contigs数量 23
Contig L50长度 5
Contig N50长度 453.6 kb
基因组长度 4.7 Mb
注释报告
基因总数 4,620
CDS总数 4,566
含蛋白质的CDS数量 4,555
ncRNA数量 3
tRNA数量 48
质量分析
完整性 99.47%
污染率 1.67%

致谢

特别感谢中国科学研究院微生物研究所(WDCM,北京100101)对MAHUQ-72菌株基因组测序工作的支持。
Md. Amdadul Huq:概念设计、数据分析、初稿撰写;Shahina Akter:数据分析与修订;Md. Shahidul Islam:数据分析与修订;Md. Shahedur Rahman:数据分析与修订。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号