
-
生物通官微
陪你抓住生命科技
跳动的脉搏
从牧场饲养的荷斯坦弗里斯兰牛中分离出的Pediococcus pentosaceus 5.5 8-1的完整基因组序列
《Microbiology Resource Announcements》:Complete genome sequence of Pediococcus pentosaceus 5.5 8-1 isolated from a pasture-kept Holstein Friesian cattle
【字体: 大 中 小 】 时间:2025年11月15日 来源:Microbiology Resource Announcements 0.6
编辑推荐:
鉴定有机牧场奶牛分离的Pediococcus pentosaceus 5.5 8-1基因组(1.73 Mbp,1671基因),利用纳米孔测序技术完成组装与验证,为环境生物多样性和食品发酵应用提供新资源。
Pediococcus pentosaceus菌株。为了进一步研究环境生物多样性及其在食品发酵中的应用,我们测定了该菌株的完整基因组序列(1.73 Mbp),该基因组包含1,671个预测基因(在NCBI数据库中的编号为5_5_8_1)。Pediococcus是一类用于食品发酵和食品保存的乳酸菌(1–3)。它们具有多种益生菌作用,并能产生有益的小分子——即所谓的后生物素(3–6)。菌株05.5 8-1是从一家有机奶牛场的荷斯坦弗里斯兰奶牛的一个乳房前乳中分离得到的。前乳被稀释到NaCl–Tween溶液中(NaCl浓度为9 g/L,Tween 80浓度为20 ml/L),然后接种到De Man、Rogosa和Sharpe(MRS)-Bouillon-agar培养基平板上(含有0.5 g/L半胱氨酸和10 mg/L溴酚蓝),并在厌氧条件下培养48小时(7)。从单个菌落中提取DNA,使用引物27f(5′-AGAGTTTGATCCTGGCTCAG-3′)和N1492r(5′-TACGGYTACCTTGTTAYGACTT-3′)进行rrnA基因(编码16S rRNA)的聚合酶链反应(8)。通过Sanger测序得到的1,067 bp长的DNA序列与Pediococcus pentosaceus ATCC 25745菌株的rrnA基因序列(NC_008525.1)完全一致(8)。该菌株在含有0.5 g/L半胱氨酸的MRS agar培养基上于30°C培养48小时。基因组DNA使用Promega公司的Wizard HMW DNA提取试剂盒提取,并用DeNovix公司的DeNovix QFX荧光仪进行定量分析。利用Oxford Nanopore SQK-RAD004试剂盒快速制备测序文库,然后将文库(30 μL)加载到安装在MinION Mk1B设备上的Flongle Flow Cell R9.4.1芯片上,运行MinKNOW v22.08.9软件进行测序(9)。原始测序数据首先使用Guppy v6.3.8(高精度模型dna_r9.4.1_450bps_hac.cfg)进行碱基校正,随后使用Dorado v0.9.6(模型dna_r9.4.1_e8_sup@v3.6)进行进一步优化(1011)。仅保留Phred质量评分≥Q9的读段。使用Porechop v0.2.4进行接头序列修剪(12),并通过Filtlong v0.2.1过滤掉质量最差的10%的读段以及长度小于1 kb的读段(13)。最终数据集包含20,519条读段(总长度71.62 Mbp,平均读段长度为2,236 bp,最长读段长度为140,560 bp,平均Phred质量分数为11;其中43.6%的碱基质量达到Q20标准,10.7%的碱基质量达到Q30标准)。质量指标使用Nanoq v0.1.0和SeqKit v2.9.0软件进行评估(1415)。使用Trycycler v0.5.4进行基因组组装,通过Flye v2.9.2、Raven v1.8.2和Miniasm v0.3等工具生成子组装序列(16–20)。使用Medaka v1.8.0对组装结果进行优化处理,通过Bandage v0.9.0验证染色体的环状结构和正确性(21)。为了进一步优化,使用Dorado Aligner将重新校正后的读段与组装结果对齐,并通过Samtools v1.22.1进行过滤(排除MAPQ评分低于20的读段、QC标记为0x200的读段、二次标记为0x100的读段以及补充标记为0x800的读段;同时保留长度≥1 kb的读段)(1122)。接着进行两轮Medaka v2.1.0和两轮Homopolish v0.4.1优化处理。最终将染色体定向到dnaA基因作为起始点(使用Dnaapler v1.2.0完成定向23–25)。P. pentosaceus ATCC 25745菌株(NC_008525.1)作为参考,通过FastANI和QUAST v5.3.0软件得到相关指标(见表1);BUSCO v5.8.3软件(数据集pediococcus_odb12)显示基因组完整性为98.9%(26–28)。CheckM2(基于神经网络的算法)确认基因组完整性为99.98%,污染率为0.13%(29)。通过minimap2 v2.30和samtools v1.22.1对过滤后的读段进行重新映射,得到染色体平均覆盖率为27倍(223031)。使用Bakta v1.8.2(数据库版本v5.0 light)预测基因组特征,共识别出1,671个蛋白质编码序列、15个rRNA基因、56个tRNA基因、1个tmRNA基因和3个ncRNA基因(总特征数为1,769个)(32)。P. pentosaceus 5.5 8-1菌株完整染色体的组装和质量指标| 重复序列 | 长度(bp) | GC含量(%) | BUSCO完整性(%) | CheckM2完整性/污染率(%) | 基因组占比(%) | 平均核苷酸同一性 |
|---|---|---|---|---|---|---|
| 染色体 | 1,731,209 | 37.4 | 98.9 | 99.98/0.13 | 86.66 | 98.61 |
生物通微信公众号
知名企业招聘