
-
生物通官微
陪你抓住生命科技
跳动的脉搏
全球最大真菌标本库历史样本的全基因组测序揭示高质量组装策略
【字体: 大 中 小 】 时间:2025年08月20日 来源:New Phytologist 8.1
编辑推荐:
这篇研究通过大规模测序皇家植物园邱园真菌标本馆的2104份历史标本(1770-2023年),系统评估了DNA提取、文库构建和基因组组装方法。研究发现标本年龄对DNA产量的影响最小,而DNA纯化方法和分类学身份影响最大。通过开发自动化流程整合16种组装方法,成功从百年以上标本中获得高质量基因组(平均单拷贝BUSCO%达86%),填补了真菌组学(fungariomics)方法学空白,为生物多样性研究和进化基因组学提供了重要资源。
大规模采样与DNA提取
研究团队从全球最大的真菌标本库——皇家植物园邱园(Kew)真菌标本馆中系统采集了2104份标本(1770-2023年),覆盖409个真菌科,其中168个科此前从未进行过全基因组测序。通过六种DNA提取方法(包括CTAB、PTB缓冲液法和商业试剂盒)的对比分析发现,分类学身份和提取方法对DNA产量影响最大:伞菌纲(Agaricomycetes)和盘菌纲(Pezizomycetes)的DNA产量显著高于其他类群,而酚-氯仿纯化法的效果优于硅胶柱法。值得注意的是,标本年龄对DNA产量的影响微弱——21世纪标本的DNA产量仅比19世纪标本高3.6倍,证明古老标本仍具研究价值。
DNA条形码与文库构建
在WGS前,研究团队通过核糖体ITS区Sanger测序验证了771份标本的DNA质量,其中319条为新发布的条形码序列。根据DNA完整度(DIN值)和片段分布,选择442份标本进行Illumina文库构建,采用三种策略:Nextera XT(低输入DNA)、TruSeq Nano(高分子量DNA)和改良版TruSeq(跳过片段化步骤)。最终获得396个高质量文库,平均插入片段455±255 bp,为后续组装奠定基础。
自动化基因组组装流程
研究团队开发了自动化流程整合五种组装工具(ABySS、Megahit、SPAdes、MaSuRCA、IDBA-UD)和两种读长处理方法(质量修剪与k-mer校正),共产生3143个组装版本。分析显示:
最佳组装的单拷贝BUSCO%平均达86%,其中159个组装超过90%,表明污染水平低且单倍型成功合并
180年历史的模式标本Hysterangium nephriticum仍能获得95% BUSCO完整度的基因组
通过ITSx分析发现72%的组装能准确匹配到属级分类单元
组装方法选择策略
线性混合模型揭示:
组装工具对质量影响最大(解释27%方差),其中MaSuRCA和SPAdes表现最优
测序深度>40M reads时,MaSuRCA优势显著(概率增加31%)
古老标本(>80年)更适合SPAdes组装,而伞菌纲偏好MaSuRCA
k-mer校正能显著降低基因组片段化(N50提高53%)
与已发表数据对比显示,该流程将162个历史标本基因组的BUSCO完整度平均提升21%,其中35个提升超40%,凸显多方法联用的价值。这项研究不仅填补了真菌组学方法学空白,更为利用全球标本馆资源开展进化基因组学和生物多样性研究提供了标准化方案。
生物通微信公众号
知名企业招聘