大肠杆菌噬菌体Midge的完整基因组

《Microbiology Resource Announcements》:The complete genome of Escherichia phage Midge

【字体: 时间:2025年11月01日 来源:Microbiology Resource Announcements 0.6

编辑推荐:

  本研究分离并注释了马蹄湖发现的Escherichia phage Midge,其基因组为29,617 bp的双链DNA,与Erwinia phage EtG和FSL SP-004相似度达75.3%和52.3%,基因功能预测显示41个功能注释,属于Peduoviridae科,为基因组工程提供新工具。

  

摘要

在本报告中,我们描述了噬菌体Midge的分离和基因组注释过程。Midge是一种类似P2噬菌体的噬菌体,其基因组长度为29,617 bp。根据核苷酸相似性分析,Midge与Erwinia噬菌体EtG的亲缘关系最为密切。

公告

大肠杆菌是一种常见于哺乳动物肠道中的共生细菌。E. coli 4s菌株是一种来自马微生物组研究的马科动物共生菌(12)。在本报告中,我们描述了感染4s菌株的噬菌体Midge的分离和基因组注释过程。
Midge是从德克萨斯州布赖恩市芬费瑟湖(Finfeather Lake,坐标30°38′55.3″N 96°22′26.3″W)的0.2 μm过滤淡水样本(10 mL)以及37°C下在溶原体培养基中厌氧培养的100 μL E. coli 4s菌株中分离出来的。该噬菌体通过软琼脂覆盖法(3)繁殖了三代。DNA提取使用的是Norgen Biotek试剂盒(#46800),按照制造商的推荐步骤进行。SeqCoast Genomics(宾夕法尼亚州匹兹堡)使用Illumina DNA Prep标签化试剂盒和NextSeq2000平台(300循环流式细胞仪)进行了测序,生成了2×150 bp的读取序列。总共1,785,843条序列读段通过FastQC(www.bioinformatics.babraham.ac.uk/projects/fastqc)进行了质量控制,并使用Shovill-SPAdes v1.1.0和默认参数(45)组装成一条contig。通过PCR和Sanger测序(使用GenBank记录中的引物PV287706.1)验证了contig的准确性和完整性;未检测到末端重复序列。根据惯例,Midge基因组的起始位置位于portal基因之前(6),随后使用Phage Galaxy和Apollo工具包(https://phage.usegalaxy.eu)进行了注释(7)。结构注释使用了GLIMMER v3.02(8)、MetaGeneAnnotator v1.0(9)和GetORFs v19.1.0.0(10);tRNA编码区由ARAGORN v19.1.0.0(11)预测。基因的功能通过BLAST v2.10.1(12)、InterProScan v5.59(13)和TMHMM v2.0(14)进行预测。支持性分析使用了HHpred工具(15)。所有软件均使用默认设置。
Midge噬菌体具有双链DNA基因组,长度为29,617 bp,G+C含量为55%,与其宿主4s的50% G+C含量相似(表1)。对Midge基因组的分析预测共有47个蛋白质编码基因,其中41个基因的功能已被确定。Midge的裂解蛋白包括一类holin(GenBank登录号XRM24217)、信号阻滞-释放内溶菌酶(XRM24218),以及一对内膜跨膜蛋白(XRM24220)和外膜跨膜蛋白(XRM24221)。Midge与Erwinia噬菌体EtG(GenBank登录号MF276773)和Salmonella噬菌体FSL SP-004(NC_021774)的核苷酸相似度分别为75.3%和52.3%。利用Virus Intergenomic Distance Calculator(VIRIDIC)(16)进行的系统发育分析表明,Midge属于Peduoviridae家族。Midge含有结构蛋白,特别是尾鞘蛋白(XRM24230.1)和尾管蛋白(XRM24231.1),这些特征以及系统发育关系表明Midge属于噬菌体。基于其基因组组织结构以及31种蛋白质的结构和功能相似性,Midge被归类为P2类噬菌体,尽管其基因组长度(29,617 bp)小于P2噬菌体(GenBank登录号NC_001895)的33,593 bp。尽管Midge和P2在基因组大小上存在差异,但它们共有的特征以及P2类噬菌体的适应性为基因组工程应用提供了可能(17)。
表1
表1 噬菌体Midge的基因组特征
特征
基因组大小(bp)29,617
GC含量(%)55
序列读段数量1,785,843
覆盖度(倍)109.8
完整性(%)100
编码序列数量47
预测的功能数量41(87.2%)
假想蛋白6(12.8%)
Genbank登录号PV287706.1

致谢

本报告中的研究得到了美国国立卫生研究院下属的国家普通医学科学研究所(National Institute of General Medical Sciences)的支持,项目编号为R35GM155289,资助人为J.R。此外,还得到了德克萨斯A&M大学和Texas AgriLife支持的Phage Technology中心(CPT)工作人员的帮助。本公告部分基于在德克萨斯A&M大学进行的本科生研究工作完成。作者还感谢弗莱堡大学(Bioinformatics部门)的Freiburg Galaxy团队在基因组注释方面的支持,该团队由Bj?rn Grüning领导,研究工作得到了德国联邦教育与研究部(BMBF)的资助(项目编号031 A538A de.NBI-RBC)以及巴登-符腾堡州科学与研究部(MWK)在LIBIS/de.NBI Freiburg项目框架内的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号