
-
生物通官微
陪你抓住生命科技
跳动的脉搏
25种草原植物全长转录组图谱解析:生态进化与功能基因组学研究新资源
【字体: 大 中 小 】 时间:2025年06月03日 来源:Scientific Data 5.8
编辑推荐:
本研究针对野生草原植物转录组资源匮乏的问题,采用PacBio Iso-Seq技术对25种中欧优势草原植物进行全长转录组测序,获得522.45百万条亚reads,平均每物种组装49,180条转录本(68.6%经Swiss-Prot注释),发现40.3%含完整ORF,36.8%为非编码RNA。该数据集为草原植物基因表达、可变剪接及进化研究提供了首个大规模全长转录组资源,填补了功能基因组学与生态保护研究的关键空白。
草原作为地球上生物多样性最丰富的生态系统之一,在碳封存、土壤肥力维持和野生动物栖息等方面发挥着不可替代的作用。然而,气候变化和土地利用转型正使草原生态系统面临前所未有的威胁。尽管科学家们已对主要农作物建立了完善的基因组数据库,但野生草原植物的转录组资源仍极度匮乏,这严重制约了人们对草原植物适应环境变化的分子机制的理解。
德国耶拿大学等机构的研究人员利用PacBio单分子实时测序技术,对来自长期生物多样性实验"耶拿实验"的25种中欧优势草原植物进行全长转录组测序分析。研究共获得522.45百万条亚reads,平均每个物种组装出49,180条转录本,其中68.6%通过瑞士Prot数据库获得功能注释。特别值得注意的是,40.3%的转录本含有完整开放阅读框(ORF),而36.8%被鉴定为非编码RNA。这项发表在《Scientific Data》的研究,首次为草原植物提供了大规模的全长转录组资源,为研究基因表达调控、可变剪接和进化模式奠定了重要基础。
关键技术方法包括:1)从耶拿实验场地采集25种草原植物茎组织样本;2)采用PacBio Iso-Seq技术进行全长cDNA测序;3)使用TransDecoder预测ORF;4)结合CPC2和PINC工具鉴定非编码RNA;5)通过RepeatMasker分析可转座元件;6)利用BUSCO评估转录组完整性。
【背景与摘要】
研究阐明了草原生态系统的重要性及当前面临的威胁,指出野生植物转录组资源的缺乏制约了相关研究。通过PacBio Iso-Seq技术,团队成功构建了25种草原植物的全长转录组图谱,平均每个物种获得49,180条转录本,其中68.6%获得功能注释。
【方法】
样本采集自耶拿实验场地,采用两种RNA提取方法确保数据质量。PacBio Iso-Seq文库构建遵循标准流程,测序数据通过ccs、lima和isoseq等工具处理,获得高质量全长非嵌合(FLNC)reads。功能注释采用BLASTx比对瑞士Prot数据库,ORF预测使用TransDecoder,非编码RNA通过CPC2和PINC鉴定。
【数据记录】
原始数据存放于NCBI SRA数据库,处理后的转录组数据可在Dryad获取。瑞士Prot注释、ORF预测、非编码RNA预测和重复元件预测结果分别存放于figshare平台。
【技术验证】
对4个已有染色体水平基因组的物种进行比对验证,结果显示超过70%的转录本能够定位到基因组独特位置,平均每个基因对应约2个转录本,证实了数据的高质量。
【讨论与结论】
该研究填补了野生草原植物全长转录组资源的空白,其创新性体现在:1)首次大规模应用Iso-Seq技术于非模式草原植物;2)揭示了草原植物中高比例的非编码RNA(36.8%)和完整ORF(40.3%);3)发现平均5.08%的碱基为重复元件。这些发现为理解草原植物的基因结构、isoform多样性和进化关系提供了全新视角,将极大推动功能基因组学、生态适应性和草原保护研究。特别值得注意的是,数据集中的豆科植物转录组信息,将为研究共生固氮等关键生态过程的分子基础提供宝贵资源。研究团队特别强调,这些资源将有助于解析植物如何应对环境变化,为制定科学的草原保护策略提供分子层面的依据。
生物通微信公众号
知名企业招聘