染色体水平基因组揭示赤眼蜂生物防治新机制:松毛虫赤眼蜂高质量基因组图谱发布

《Scientific Data》:Chromosome-level genome assembly of Trichogramma ostriniae Pang & Chen (Hymenoptera: Trichogrammatidae)

【字体: 时间:2025年12月21日 来源:Scientific Data 6.9

编辑推荐:

  为解决松毛虫赤眼蜂(Trichogramma ostriniae)缺乏高质量基因组资源,从而限制其作为重要生物防治天敌的深入研究和应用的问题,研究人员开展了染色体水平基因组组装研究。该研究通过整合PacBio长读长测序、Hi-C支架和ONT全长转录组测序技术,成功构建了大小为221.86 Mb、锚定到5条染色体上的高质量基因组,并注释了12,707个蛋白质编码基因。该基因组组装质量高,BUSCO完整性达98.3%,为研究寄生蜂的进化、体型小型化及生物防治应用提供了宝贵的遗传资源。

  
在农业生态系统中,寄生蜂是一类至关重要的“天敌昆虫”,它们通过寄生害虫的卵或幼虫来抑制害虫种群,是生物防治的明星物种。其中,松毛虫赤眼蜂(Trichogramma ostriniae)因其对亚洲玉米螟(Ostrinia furnacalis)等重大农业害虫具有卓越的防治效果而备受关注。研究表明,与同为赤眼蜂属的松毛虫赤眼蜂(T. dendrolimi)相比,松毛虫赤眼蜂在田间防治中表现出更强的控害能力,被誉为生物防治的“利器”。然而,尽管其应用价值巨大,科学家们对其内在的遗传机制却知之甚少,这主要归咎于一个关键瓶颈——缺乏高质量的基因组参考序列。没有一张精确的“遗传地图”,就无法深入解析其寄生适应性、体型小型化、寄主范围转换等关键生物学性状的分子基础,严重制约了其作为生物防治天敌的进一步开发和利用。
为了打破这一瓶颈,南京农业大学植物保护学院农业生物安全全国重点实验室的Sheng, X.、Yao, T.-Y.、Li, Y.-X.和Yan, Z.-C.*团队在《Scientific Data》上发表了题为“Chromosome-level genome assembly of Trichogramma ostriniae Pang& Chen(Hymenoptera: Trichogrammatidae)”的研究论文。该研究成功构建了松毛虫赤眼蜂的染色体水平高质量基因组,为深入探索寄生蜂的进化生物学和推动生物防治应用提供了宝贵的遗传资源。
为了完成这项研究,作者团队采用了多组学整合的策略。首先,他们从实验室长期饲养的松毛虫赤眼蜂雌性个体中提取了高质量的DNA和RNA。随后,利用PacBio Sequel II平台进行长读长测序,以获取高精度的基因组序列;利用Illumina NovaSeq X Plus平台进行Hi-C测序,用于染色体构象捕获和支架锚定;利用Illumina NovaSeq 6000平台进行短读长测序,用于基因组调查和纠错;并利用Oxford Nanopore Technologies(ONT) PromethION平台进行全长转录组测序,以辅助基因注释。在生物信息学分析方面,研究团队利用Hifiasm软件进行基因组从头组装,利用Juicer和3D-DNA软件进行Hi-C数据分析和染色体支架构建,并利用EDTA和RepeatMasker进行重复序列注释。最后,通过整合从头预测、同源比对和转录组证据,利用EVM和PASA软件进行基因结构预测和优化,最终获得了高质量的基因组注释结果。
研究结果
基因组测序与组装
研究团队通过多平台测序,共获得了11.43 Gb的PacBio长读长数据、8.36 Gb的Illumina短读长数据、56.75 Gb的Hi-C数据和85.01 Gb的转录组数据。利用Illumina数据进行的k-mer分析显示,松毛虫赤眼蜂的基因组大小估计为208.01 Mb,杂合度为0.207%。通过整合PacBio HiFi数据和Hi-C数据,最终组装出的基因组大小为221.86 Mb,其中93.14%的序列被成功锚定到5条染色体上。该组装表现出极高的连续性,其重叠群N50(contig N50)和支架N50(scaffold N50)分别达到12.42 Mb和39.71 Mb,最长的支架长度为55.07 Mb。利用BUSCO(Benchmarking Universal Single-Copy Orthologs)软件评估基因组完整性,结果显示其完整性高达98.3%,表明这是一个高质量的基因组组装。
重复序列与非编码RNA注释
研究人员对基因组中的重复序列进行了系统注释。结果显示,松毛虫赤眼蜂基因组中重复序列总长度为61.91 Mb,占基因组总大小的27.90%。其中,DNA转座子(DNA transposons)占比最高,为13.35%,其次是长末端重复序列(LTRs),占比为8.32%。此外,研究还预测了1513个非编码RNA(ncRNAs),包括781个核糖体RNA(rRNAs)和732个转运RNA(tRNAs)。
基因预测与功能注释
通过整合从头预测、同源比对和转录组证据,研究团队在松毛虫赤眼蜂基因组中成功预测了12,707个蛋白质编码基因。利用BUSCO评估基因集的完整性,结果显示其完整性达到94.4%,表明基因注释质量极高。进一步的功能注释显示,共有85.32%的预测基因获得了功能注释,这些基因被成功比对到非冗余蛋白(Nr)数据库、SwissProt数据库,并获得了基因本体论(GO)术语和京都基因与基因组百科全书(KEGG)通路等注释信息。
结论与讨论
本研究成功构建了松毛虫赤眼蜂的染色体水平高质量基因组。该基因组组装大小为221.86 Mb,其中93.14%的序列被锚定到5条染色体上,组装连续性和完整性均处于较高水平。通过整合多组学数据,研究团队共注释了12,707个蛋白质编码基因,其中85.32%的基因获得了功能注释。该基因组组装和注释的BUSCO完整性分别达到98.3%和94.4%,充分证明了其高质量和高可靠性。
这一高质量基因组资源的发布具有里程碑式的意义。首先,它为研究寄生蜂的进化生物学提供了关键数据,特别是为解析寄生蜂体型小型化、性状丢失(如卵黄合成缺失)以及寄主范围转换等关键进化事件的分子机制奠定了基础。其次,该基因组将极大地促进松毛虫赤眼蜂作为生物防治天敌的应用研究,通过基因组信息可以筛选和鉴定与寄生能力、环境适应性相关的关键基因,从而指导天敌昆虫的选育和改良。最后,该研究也为赤眼蜂属的比较基因组学研究提供了新的重要参考,将有助于揭示该属物种的物种形成和适应性进化历史。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号