
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于纳米孔全长转录组测序揭示山羊肌肉发育的基因调控机制及肉品质形成基础
《Scientific Data》:Transcriptomics data for muscle development in Goats
【字体: 大 中 小 】 时间:2025年06月03日 来源:Scientific Data 5.8
编辑推荐:
本研究针对山羊肌肉发育关键基因表达谱和转录调控机制缺乏全长转录组数据的瓶颈问题,采用牛津纳米孔技术(ONT)对妊娠后期母羊及胎儿的背最长肌和股二头肌进行全长转录组测序,获得169,768,069条有效读长,鉴定58,092个全长转录本和89,468个可变剪接(AS)事件,预测5,538个长链非编码RNA(lncRNA),为解析山羊肌肉发育的表观遗传调控和早期营养干预提供了重要数据资源。该成果发表于《Scientific Data》期刊,对推动山羊精准育种和肉质改良具有重要价值。
在全球畜牧业生产中,山羊作为重要的经济畜种,其肉质因高蛋白、易消化等特性备受青睐。然而,决定肉品质的关键部位——背最长肌和股二头肌的分子调控机制仍存在诸多未解之谜。传统二代测序技术受限于读长,难以全面解析基因的可变剪接(AS)和异构体多样性,这严重制约了山羊肌肉发育的遗传机制研究和精准育种实践。
针对这一科学难题,湖南农业大学动物科学技术学院联合岳麓山实验室的研究团队,选择具有优质肉用特性的湖田山羊为研究对象,创新性地采用牛津纳米孔技术(Oxford Nanopore Technologies, ONT)平台,对妊娠90天的母羊及胎儿两种肌肉组织进行全长转录组测序。这项研究不仅填补了山羊肌肉全长转录组数据的空白,更为揭示肌肉发育的时空动态调控网络提供了关键线索。
研究团队采用ONT长读长测序技术,结合生物信息学分析流程,对12只湖田山羊的肌肉样本进行系统研究。样本包括妊娠后期母羊及其胎儿的背最长肌和股二头肌,通过混合建库策略提高数据代表性。关键技术包括:使用Pychopper软件进行全长序列识别,minimap2进行基因组比对,StringTie进行转录本重构,并采用CNCI、CPC2和PLEK三种算法预测lncRNA,SUPPA2分析可变剪接事件。
【测序质量评估】研究获得169,768,069条有效读长,平均N50达1042.29bp,其中81.8%为全长序列。与参考基因组比对率达72.3%,显示出高质量的数据产出。样本间表达相关性分析证实数据具有良好的生物学重复性,为后续分析奠定基础。
【转录本注释与功能分析】共鉴定58,092个全长转录本,其中50,338个获得NR、Uniprot等数据库注释。GO功能富集显示"DNA模板转录调控"、"蛋白水解"等过程显著富集,KEGG分析揭示多条与肌肉发育相关的信号通路。特别值得注意的是,研究发现了8,534个新转录本,通过gffcompare分析将其分类为内含子保留型(I)、外显子跳跃型(J)等不同类型。
【lncRNA预测】通过CNCI、CPC2和PLEK交叉验证,预测出5,538个潜在lncRNA,这些非编码RNA平均长度显著长于编码RNA,且CDS区长度多小于300bp。该发现扩展了对山羊肌肉发育调控网络的认识,特别是表观遗传调控层面。
【可变剪接分析】研究鉴定出89,468个AS事件,涵盖7种类型:外显子跳跃(SE,30.66%)、5'端可变剪接(A5,14.17%)、3'端可变剪接(A3,18.16%)、首个外显子可变剪接(AF,25.63%)、末尾外显子可变剪接(AL,5.35%)、互斥外显子(MX,1.87%)和内含子保留(RI,4.05%)。这些发现为解析肌肉特异性异构体的功能多样性提供了新视角。
这项研究通过ONT长读长测序技术,首次系统构建了山羊肌肉发育的全长转录组图谱,填补了该领域的数据空白。所鉴定的lncRNA和AS事件为理解肌肉发育的转录后调控机制提供了新线索,特别是妊娠期母体-胎儿间的基因表达调控网络。数据资源已存入NCBI SRA数据库(SRP531789),为后续功能基因挖掘、分子标记开发和精准育种策略优化提供了重要基础。该成果不仅推动山羊肌肉生物学研究的深入发展,也为改善肉品质和畜牧业可持续发展提供了科学依据。
生物通微信公众号