一种高质量的基因组序列,来自马匹顶复门血寄生虫Theileria haneyi Eagle Pass分离株

《Microbiology Resource Announcements》:A high-quality genome sequence of the equine apicomplexan hemoparasite Theileria haneyi Eagle Pass isolate

【字体: 时间:2025年12月13日 来源:Microbiology Resource Announcements 0.6

编辑推荐:

  该研究通过Illumina MiSeq和Nanopore MinION测序技术获得Theileria haneyi Eagle Pass分离株高质量基因组,包含四个核染色体、线粒体和质体基因组。NECAT组装后得到5条长contig,N50达2427405bp,校正了前 draft genome中染色体1与3的融合问题,明确了染色体大小与结构,为表型组学分析和疫苗开发奠定基础。

  

摘要

利用Illumina Miseq和Nanopore MinION技术,获得了马匹顶复门蜱传血液寄生虫(Eagle Pass分离株)的高质量基因组序列。这些数据生成了四个核染色体以及线粒体和顶质体的高质量组装序列。

公告

Theileria haneyi是一种蜱传的顶复门血液寄生虫,与Theileria equi一起,会导致马匹梨形虫病(EP),这是一种限制全球马匹流动的需报告疾病(1)。T. haneyi的毒力低于T. equi;然而,其对马类的影响仍不清楚(2, 3)。此前已报道了来自美国德克萨斯州Eagle Pass(坐标:28°42.5484' N 100°29.9712' W)的分离株的基因组草图(2),其中包含高达3%的未分配碱基(N),这些碱基被映射到了的基因组上,可能会影响染色体的结构。高质量的基因组对于理解寄生虫生物学特性以及开发有效的诊断方法、治疗方法和疫苗至关重要。
本研究从一匹接受脾切除术且感染了 Eagle Pass分离株的马(Ho-208)的血液中分离出了寄生虫DNA(遵循爱达荷大学动物护理规程2016–2018年版本,详见其他文献4, 5)。当被寄生虫感染的红细胞比例达到8%时,收集外周血并清洗以去除白细胞(2)。使用Qiagen DNeasy Blood & Tissue Kit(Qiagen公司,美国马里兰州杰曼敦)提取用于测序的DNA。对于短读长测序,使用Nextera XT Library Preparation Kit制备基因组文库,并通过Illumina MiSeq V2流式细胞仪进行500个循环的测序(每个循环250 bp,Illumina公司,美国加利福尼亚州圣地亚哥)。对于长读长测序,采用PacBio Short-Read Eliminator Kit(SRE XS kit,PacificBiosciences公司,美国加利福尼亚州门洛帕克)进行文库制备,并使用LSK-SQK109连接测序试剂盒(Oxford Nanopore Technologies公司,英国牛津)进行测序。基因组文库在MinION平台上使用Guppy(v.4.4.2)高精度设置进行碱基 calling,并使用PoreChop进行接头修剪(6, 7)。质量评估通过SeqKit(MiSeq)和NanoPlot(MinION)完成(8, 9)。
共获得621,912条MinION测序数据,平均长度为11,673个碱基对(bp),N50值为13,831,总长度为7,260,822,600 bp,覆盖度约为702倍。NECAT(v.0.0.1)草图组装产生了五个长连续片段,对应四个染色体以及推测的顶质体和线粒体DNA元件(表1)。MiSeq配对文库产生了3,263,928条测序数据(平均长度224 bp),总长度为731,119,872个碱基,覆盖度为71倍。长读长数据使用Medaka v.1.1.1进行错误校正(10, 11),短读长数据使用BWA(v.0.7.17)进行映射,Pilon(v.1.22)用于碱基 calling校正(12, 13)。顶质体和线粒体的序列是从原始连续片段中随机位置开始的。最终组装序列长度为10,337,269 bp,N50值为2,427,405 bp,GC含量如表1所示。NECAT、Medaka和Pilon均使用默认参数运行。五个长序列组装中有三个两侧包含端粒重复序列5-′G2-3 T3-4 A-3′(14),表明这些是完整的染色体(表1)。其中两个序列的一端有端粒,可能代表第四条染色体,其间隙大小未知。与之前的草图基因组(GCA_002189625)比对后发现,新的组装版本中第一条染色体(长度约为4.0 MB)包含了之前草图基因组中标记为1和3的染色体(图1)。这个高质量的基因组中没有未分配的碱基(N),明确了染色体的大小和结构。
图1
基因组比对图显示了JBNLZY和LAPW组装版本在染色体上的保守同线性区域(用彩色块表示)、重排和倒位,突出了两个基因组之间的结构差异。
图1 使用Mauve软件(版本2.4.0,2025年3月18日从https://darlinglab.org/mauve/mauve.html下载)对更新的JBNLZY000000000和草图版本的GCA_002189625Theileria haneyi基因组进行了比对。相同颜色的块表示两个基因组之间的同源序列。相同颜色的线条连接了同源的块。局部共线块(LCB)的权重设置为47,542,使得块在图像中呈现为实心状。标签表示GenBank中的组装编号,垂直的黑线定义了大致的组装边界。比对基于连接的FASTA文件生成,除了块的颜色外,没有发现其他关系。
表1
表1 T.haneyi Eagle Pass分离株基因组组装
组装名称访问号长度(bp)GC含量(%)识别的端粒
染色体1JBNLZY010000002.14,054,65540.432
染色体2片段aJBNLZY010000001.12,427,40542.091
染色体3JBNLZY010000003.11,792,25740.972
染色体4JBNLZY010000004.11,590,12741.662
染色体2片段bJBNLZY010000005.1429,11042.761
顶质体JBNLZY010000006.134,68426.64N/Aa
线粒体DNAJBNLZY010000007.19,03129.83N/A
a
N/A,数据不可用。

致谢

本研究由美国农业部农业研究服务局(USDA-ARS)CRIS项目# 2090-32000-044-000-D资助。
我们感谢Shelby Beckner和Megan Jacks在技术支持和动物护理方面的出色贡献。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号