
-
生物通官微
陪你抓住生命科技
跳动的脉搏
HiMT:基于HiFi测序数据的植物细胞器基因组一站式组装工具包及其应用研究
【字体: 大 中 小 】 时间:2025年07月31日 来源:Plant Communications 11.6
编辑推荐:
针对植物细胞器基因组组装存在的重复序列复杂、重组频繁及现有工具安装繁琐、资源消耗大等问题,研究人员开发了HiMT工具包。该工具通过优化k-mer前缀策略和深度估计算法,实现了线粒体(MT)和叶绿体(CP)基因组的一键式组装,成功率达93%,且内存需求仅为PMAT的1/10。其跨平台图形界面和交互式质量报告为植物细胞器研究提供了高效解决方案,相关成果发表于《Plant Communications》。
植物细胞器基因组研究长期以来面临两大技术瓶颈:线粒体基因组(mitogenome)因频繁重组和重复序列导致组装困难,而现有工具如PMAT和TIPPo存在参数调试复杂、计算资源消耗高等问题。尤其对于香蕉等复杂基因组(>10 Mb),传统方法更是束手无策。这一困境严重制约了植物进化分析和分子育种研究。
中国热带农业科学院热带作物品种资源研究所(Key Laboratory of Crop Gene Resources and Germplasm Enhancement in South China)领衔的研究团队,开发出创新性工具HiMT。该工具通过三大突破性设计:基于保守基因的深度反向估算、固定3-bp前缀的k-mer筛选策略(内存消耗降低至1/64),以及Flye组装的跨平台重构,成功实现植物线粒体和叶绿体基因组的"一键式"组装。测试表明,HiMT在菠萝(Ananas comosus)和水稻(Oryza sativa)中的组装结果与PMAT完全一致(ANI>99.99%),且对26个物种的组装成功率达93%,而硬件需求仅需普通笔记本电脑。相关成果发表在《Plant Communications》期刊。
关键技术包括:1)利用tBLASTn比对24个保守线粒体基因估算测序深度;2)采用21-mer前缀过滤策略(默认4组3-bp组合)降低计算复杂度;3)整合Plotly库生成交互式质量报告,包含基因保守性热图、Circos环形基因组图谱等模块;4)测试数据涵盖菠萝、水稻等28个植物物种及5种动物线粒体样本。
研究结果揭示:
算法优化与流程设计
通过固定k-mer前缀策略,HiMT将内存占用从PMAT的31.83 GB降至3.4 GB,同时保持99.95%-100%的组装一致性。在香蕉(Musa acuminata)等复杂基因组中,虽未实现完美组装,但获得9.2 Mb连续性片段。
功能特性
跨平台支持Windows原生运行,提供四种操作模式:Assembly(组装)、Read Filter(读段过滤)、Quality Assess(质量评估)和Compare(结果比对)。图形界面可直观展示组装图谱,如菠萝线粒体911,652 bp环状结构的完美呈现。
组装效能评估
与PMAT相比,HiMT在浮藓(Pohlia nutans)组装中速度快2.5倍,内存消耗仅为TIPPo的1/28(97 GB→3.4 GB)。叶绿体基因组组装成功率近100%,动物线粒体测试也表现优异。
质量评估体系
首创的交互式报告包含:1)保守基因相似度热图(如atp6、cox1等);2)滑动窗口GC含量分析;3)深度分布曲线。在拟南芥(Arabidopsis thaliana)测试中,成功检出16.58%重复序列。
该研究突破了植物线粒体基因组组装的三大技术壁垒:计算资源、自动化程度和评估标准。HiMT的创新性体现在:1)首次实现k-mer分析的"轻量化"处理;2)建立首个植物线粒体组装质量评价体系;3)图形化界面降低使用门槛。尽管对超复杂基因组的组装仍有改进空间,但该工具已为植物细胞器研究提供了标准化解决方案,其技术框架可拓展至动物线粒体等其他非核基因组研究领域。
生物通微信公众号
知名企业招聘