
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于PacBio Hi-Fi长读长测序的中间鹿角珊瑚(Acropora intermedia)高质量基因组重注释与组装
【字体: 大 中 小 】 时间:2025年08月29日 来源:Scientific Data 6.9
编辑推荐:
本研究针对珊瑚礁关键物种中间鹿角珊瑚(Acropora intermedia)基因组组装质量不足的问题,采用PacBio Hi-Fi长读长测序技术完成496.8 Mb的高质量基因组组装,Contig N50提升至2.9 Mb,BUSCO完整性达92.6%,预测26,852个蛋白编码基因。该研究为解析珊瑚环境适应机制提供了关键分子资源,对珊瑚礁生态系统保护具有重要价值。
珊瑚礁作为海洋中的"热带雨林",孕育着地球上25%的海洋生物多样性。然而这些由造礁珊瑚构建的生态系统正面临前所未有的生存危机——过去十年全球近14%的珊瑚礁已经退化。在气候变化背景下,理解珊瑚的环境适应机制显得尤为重要。作为印度-太平洋海域主要的造礁珊瑚属,鹿角珊瑚(Acropora)因其丰富的物种多样性和生态重要性成为研究焦点。2020年中国大湾区大规模白化事件中,中间鹿角珊瑚(A. intermedia)表现出显著的热耐受性,使其成为研究珊瑚白化和杂交现象的理想模型。
此前基于短读长测序的A. intermedia基因组(GCA_014634585.1)存在组装碎片化严重(Contig N50仅40.3 Kb)、模糊碱基多(每100 Kbp含5,276.11个N)等问题,制约了结构变异、基因家族进化等关键分析。为此,研究团队通过PacBio Hi-Fi长读长测序技术完成了新一代基因组组装,并进行了系统性重注释。
研究主要采用三项关键技术:1)基于凤凰岛采集的样本,通过胶原酶消化和差速离心分离珊瑚细胞进行DNA提取;2)使用PacBio Sequel II平台进行HiFi测序,经Hifiasm组装和Racon三轮抛光获得最终基因组;3)整合RepeatModeler重复序列预测、Augustus基因预测和RNA-seq证据进行多维度基因组注释。
【Genome assembly and genome quality assessment】
新一代基因组大小为496.8 Mb,仅含633个contigs,Contig N50达2.9 Mb,最长contig为11.8 Mb。与旧版相比,BUSCO完整性从90.6%提升至92.6%,完全消除了模糊碱基(N's per 100 Kbp从5,276.11降至0)。Blobtools分析显示95.85%的测序reads能定位到基因组,99.76%的contigs属于刺胞动物门。

【Repeat annotation】
重复序列占基因组的48.24%,其中未分类重复占比最高(20.37%)。转座元件中LTR反转录转座子最为丰富(8.98%),DNA转座子占9.06%。这些重复元件的准确注释为研究基因组进化提供了基础。
【Gene prediction and annotation】
通过整合多种证据预测26,852个蛋白编码基因,BUSCO评估显示基因模型完整性达95.7%(较旧版提升2.7%)。非编码RNA注释发现12,556个tRNA、4,332个rRNA和134个miRNA。功能注释显示99.1%的基因获得功能预测,其中60.02%注释到eggNOG数据库,34.81%映射到KEGG通路。

该研究构建了目前最高质量的A. intermedia基因组资源,其连续性指标(Contig N50)较旧版提升73倍,为解析珊瑚的热耐受机制和杂交适应性进化提供了关键分子基础。特别值得注意的是,该基因组中鉴定到的谱系特异性基因家族扩张和选择信号区域,可能与珊瑚应对环境压力的生存策略密切相关。这些发现不仅有助于理解造礁珊瑚的进化历史,也为珊瑚礁生态系统的保护与修复提供了科学依据。
研究数据已存储于NCBI(SRP566323)和GenBank(GCA_048544155.1),为后续比较基因组学和环境适应研究奠定了坚实基础。随着更多珊瑚基因组资源的释放,这类研究将有助于揭示珊瑚应对气候变化的分子机制,指导珊瑚礁保护策略的制定。