
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于PacBio HiFi和Hi-C测序的吉氏金线鲃染色体水平基因组组装及其进化意义
【字体: 大 中 小 】 时间:2025年07月27日 来源:Scientific Data 5.8
编辑推荐:
本研究通过整合PacBio HiFi长读长、Illumina短读长和Hi-C测序数据,首次完成了洞穴鱼类吉氏金线鲃(Sinocyclocheilus jii)染色体水平基因组组装(1.75Gb,contig N50 35.0Mb),填补了金线鲃属基部类群(Clade A)基因组空白。研究人员利用流式细胞术和k-mer分析验证基因组大小,通过Hi-C数据将99.3%序列锚定至50条染色体,注释出52,867个蛋白编码基因。该高质量基因组为研究洞穴鱼类适应性辐射和趋同进化提供了关键资源,成果发表于《Scientific Data》。
在神秘的地下洞穴生态系统中,吉氏金线鲃(Sinocyclocheilus jii)作为中国特有的洞穴鱼类,其独特的形态特征和生存策略长期吸引着进化生物学家的目光。这类隶属于鲤科(Cyprinidae)的鱼类,因长期适应黑暗环境而演化出眼睛退化、体色消失等特殊性状,成为研究适应性进化的天然模型。然而,该属物种复杂的多倍化历史和高度分化的形态特征,使得其系统发育关系和遗传机制研究长期受限于基因组资源的匮乏。尤其值得注意的是,作为金线鲃属系统发育树基部类群(Clade A)的代表物种,吉氏金线鲃的基因组信息长期缺失,严重阻碍了对该类群起源和进化驱动力的深入解析。
针对这一关键科学问题,云南大学生态与环境学院的研究团队在《Scientific Data》发表了突破性研究成果。通过整合第三代PacBio HiFi长读长测序、Hi-C染色体构象捕获和RNA-seq转录组数据,首次构建了吉氏金线鲃染色体水平的高质量参考基因组。研究不仅揭示了该物种特有的基因组特征,更为解开洞穴鱼类适应性进化之谜提供了全新的分子工具。
研究团队采用多组学联用策略:首先通过流式细胞术(以鸡血细胞为内参)和k-mer分析(k=21/25/27/31)双重验证基因组大小;利用PacBio Sequel II平台产生107.8Gb HiFi数据(N50 18.67kb),结合182.93Gb Hi-C数据,采用HiFiasm(v0.16.1)进行单倍型解析组装;通过HapHiC(v1.0.6)将99.3%序列锚定至50条染色体(2n=100);运用RepeatModeler2和BRAKER3管道完成重复序列注释和52,867个基因的功能预测。
【背景与摘要】
研究确认吉氏金线鲃基因组大小为1.75Gb,与流式结果(1.79Gb)高度一致。染色体分析显示典型四倍体特征(2n=100),BUSCO评估完整性达98.9%,其中72.4%为重复基因,暗示鲤科鱼类特有的古多倍化事件。
【方法】
细胞遗传学分析采用头肾组织低渗滴片法制备染色体标本,Giemsa染色显示清晰核型。基因组测序选用肌肉组织DNA,Hi-C文库构建采用甲醛交联优化方案。RNA-seq涵盖心、肝、脑等5种组织,支持基因模型预测。
【数据记录】
所有原始数据存放于国家基因组科学数据中心(PRJCA040420),包括PacBio(CRR1866088)、Hi-C(CRR1866083-7)和转录组(CRR1866078-82)数据。染色体级组装已提交GenBank(JBMPHT000000000)。
【技术验证】
Hi-C互作图谱显示50条染色体明确相互作用区块(图3)。转座元件分析揭示29.31%为DNA转座子,8.0%为LTR,LINE占4.59%(表2)。基因功能注释显示51,932个基因(98.3%)在eggNOG、KEGG等数据库获得功能标签(图5)。
【结论与意义】
该研究首次揭示了基部类群金线鲃的基因组架构特征:1)四倍体核型(2n=100)与高重复序列含量(50.59%)反映鲤科鱼类基因组扩张机制;2)比较基因组分析显示Clade A特有基因家族扩张,可能关联洞穴适应;3)15条染色体实现无gap单contig组装,为后续比较基因组研究提供黄金标准。研究成果不仅填补了洞穴鱼类关键演化节点的基因组空白,更为理解脊椎动物极端环境适应提供了新视角。云南大学团队建立的这套多组学整合方案,为其他复杂基因组物种研究提供了可复制的技术路线。
生物通微信公众号
知名企业招聘