
-
生物通官微
陪你抓住生命科技
跳动的脉搏
夏威夷科纳Typica咖啡染色体水平基因组组装揭示其优异品质与抗病性遗传基础
【字体: 大 中 小 】 时间:2025年07月30日 来源:Scientific Data 5.8
编辑推荐:
研究人员针对优质但易受病虫害影响的夏威夷科纳Typica咖啡(Coffea arabica L. var. 'Kona Typica'),采用PacBio HiFi测序和Hi-C支架技术完成首个染色体水平基因组组装(1.13Gb,N50 50.50Mb),注释65,458个蛋白编码基因并发现65.16%的基因组为转座元件。该研究为解析咖啡品质形成和抗病机制提供了关键资源,将加速抗病优质品种选育。
咖啡作为全球最重要的经济作物之一,其风味独特的阿拉比卡种(Coffea arabica)占据全球产量的60-70%。然而这个四倍体物种(2n=44)起源于两个二倍体祖先——罗布斯塔咖啡(C. canephora)和尤金尼奥德斯咖啡(C. eugenioides)的杂交事件,其基因组演化机制长期困扰研究者。更严峻的是,夏威夷科纳地区特有的Typica品种虽以卓越杯测品质闻名,却因遗传基础狭窄而极易受咖啡叶锈病(CLR)和咖啡浆果病(CBD)侵害。2020年CLR在夏威夷的暴发,使得解析其基因组特征成为育种攻关的当务之急。
美国农业部太平洋盆地农业研究中心(Daniel K. Inouye U.S. Pacific Basin Agricultural Research Center)领衔的研究团队在《Scientific Data》发表了突破性成果。通过整合PacBio HiFi长读长测序(平均读长12,224bp)和Omni-C染色质构象捕获技术,成功构建了首个染色体水平的'Kona Typica'基因组。该组装将1.13Gb序列锚定到22条染色体,支架N50达50.50Mb,BUSCO评估显示99.1%的完整性。研究人员还创新性采用LTR相似度矩阵分析,揭示了转座元件在异源多倍化后的爆发式增殖规律。
关键技术包括:(1)从夏威夷农业研究中心(Hawaii Agriculture Research Center)种植的KO34植株提取高分子量DNA;(2)PacBio Sequel II平台产生135Gb HiFi数据;(3)Hi-C辅助单倍型分型;(4)Merqury评估显示组装质量值(QV)达57.72;(5)整合同源预测、RNA-seq和从头预测方法注释基因功能。
基因组组装与质量评估
研究获得包含967个支架的1.17Gb最终组装,其中97%序列锚定到22条染色体。通过比较亚基因组(subC和subE)与祖先种的共线性关系,证实了四倍体咖啡的杂交起源假说。特别值得注意的是,LTR-Gypsy类转座元件占基因组26.41%,其增殖高峰(0.05-0.15百万年前)与多倍化事件(约0.665百万年前)存在明显时序关联。
重复序列与基因注释
RepeatMasker鉴定出占基因组65.16%的1,073,545个分散重复序列。通过整合多种预测方法,研究人员发现'Kona Typica'含有65,458个蛋白编码基因,其中94.1%呈现四倍体典型的重复拷贝特征。KEGG注释显示26,173个基因具有通路信息,为后续品质相关代谢网络研究奠定基础。
遗传变异特征
通过比对HiFi reads检测到6,873个SNP和240,883个INDEL,这些变异位点为分子标记开发提供了候选位点。研究还发现亚基因组间存在显著的结构变异,可能与抗病性分化相关。
该研究首次绘制了优质咖啡品种的精细基因组图谱,不仅揭示了转座元件在多倍体基因组演化中的关键作用,更为分子设计育种提供了精准导航。基因组数据已存入NCBI(GCA_049114775.1),变异信息开放于国家基因组数据中心(GVM001114)。这项成果将显著加速抗病基因挖掘进程,对于保护夏威夷特色咖啡产业具有战略意义。Haomin Lyu、Jinjin Song等作者特别强调,该参考基因组有望破解咖啡品质与抗性负相关的育种难题,为全球咖啡产业可持续发展提供新范式。
生物通微信公众号
知名企业招聘