基于长读长直接RNA测序的成年果蝇大脑转录组生理与病理状态分析

【字体: 时间:2025年10月15日 来源:BMC Genomics 3.7

编辑推荐:

  本研究针对传统短读长RNA测序难以准确解析高度加工RNA异构体的技术瓶颈,采用牛津纳米孔技术直接RNA测序方法,系统绘制了成年果蝇头部转录组的完整异构体图谱。研究人员在生理状态下发现930个未收录参考转录组的新转录本,近半数异构体具有超长polyA尾(>104 nt),59%转录本存在m6A修饰,并首次实现转座子来源RNA的位点特异性鉴定。在tauopathy疾病模型中,研究揭示了致病性tau蛋白引起的polyA尾延长、m6A修饰异常和转座子激活等转录组紊乱特征,为神经退行性疾病研究提供了重要技术范式和数据资源。

  
当我们试图理解大脑如何通过有限的基因编码出极其复杂的神经功能时,RNA的转录后加工过程扮演着关键角色。神经元作为高度特化的细胞,其转录组多样性远超其他细胞类型——包括大量的选择性剪接事件、多聚腺苷酸化位点选择以及丰富的RNA甲基化修饰。然而,传统短读长RNA测序技术(50-150 bp)在解析这些复杂转录本时面临巨大挑战:共享外显子和外显子-外显子连接区会产生多重映射的模糊读段,使得准确重建和量化高度加工的RNA异构体变得异常困难。
特别是在神经退行性疾病如阿尔茨海默病和相关tau蛋白病中,异常RNA加工与疾病病理的关联日益受到关注。研究表明,果蝇和人类tauopathy脑组织中存在异常的RNA聚集灶,提示转录后RNA处理错误可能与神经退行性变存在机制联系。但由于神经元重塑和重连过程中转录组的极端动态变化,识别可能导致神经退行性变的错误RNA转录本仍然充满挑战。
在这项发表于《BMC Genomics》的研究中,Paulino Ramirez、Gabrielle Zuniga等研究人员采用牛津纳米孔技术直接RNA测序方法,对成年果蝇头部转录组进行了全面分析。果蝇大脑虽然结构相对简单,但其神经元占头部细胞的主要组成部分,是研究神经转录组学的理想模型。研究团队不仅分析了生理状态下的转录组特征,还特别关注了表达人类突变tau蛋白的tauopathy疾病模型,旨在揭示病理状态下RNA加工异常的特征。
研究采用的关键技术方法主要包括:利用纳米孔直接RNA测序技术对果蝇头部提取的天然RNA进行全长转录本测序;通过SQANTI和FLAIR流程进行转录本结构分类和新异构体识别;应用nanopolish和tailfindr工具分析polyA尾长度;采用m6Anet和xPore算法检测m6A修饰位点;结合Illumina短读长测序数据进行方法学比较;所有实验均使用10日龄成年果蝇头部样本,设三个生物学重复。
直接长读长RNA测序果蝇头部转录本
研究首先验证了纳米孔直接RNA测序的数据质量,测序深度达到每个样本约100万读段,中位读段质量为9以上,91-92%的读段能够映射到果蝇参考基因组。平均比对读段长度为1,363 nt,与cDNA来源读段的1-2 kbp长度相当。当设置更严格的标准要求读段同时覆盖转录起始位点和多聚腺苷酸化位点时,约3%的读段被归类为全长转录本。
与Illumina 150 bp测序相比,纳米孔测序虽然产生的读段数量较少(300万 vs. 2.23亿),但两种方法的转录本量化高度一致(R=0.73)。值得注意的是,长读长组装的新转录本数量显著多于短读长测序,表明长读长测序在发现新异构体方面具有明显优势。
果蝇头部非参考剪接变体的识别
通过SQANTI分析流程,研究人员对果蝇头部转录组的剪接变体进行了详细分类。结果显示,完全剪接匹配的转录本占91.6%,不完全剪接匹配占1.51%。完全剪接匹配转录本的长度往往比FlyBase参考转录组中注释的长度更长,表明长读长测序能更准确地捕获具有较大5'和3'末端变异的转录本。
研究发现,新型参考转录组内转录本占3.7%,新型非参考转录组内转录本占1.57%,基因间区转录本占1.59%。与Illumina短读长相比,长读长在检测新型参考转录组内转录本和过滤可能来自RNA降解的基因片段方面具有更强能力。特别值得注意的是,内含子保留是长读长RNA测序识别的最主要的可变剪接事件,而在短读长RNA测序中则不明显,这表明果蝇神经元主要通过内含子保留来增加转录本的多样性。
基于长读长测序的果蝇头部polyA尾长度分析
研究人员对RNA异构体的polyA尾修饰进行了定性和定量分析。纳米孔直接RNA测序能有效检测到长度达约250 nt的polyA尾,果蝇头部每个异构体的中位polyA尾长度为82.6 nt,与小鼠视觉皮层和小鼠脑中的polyA尾长度相当,表明小鼠中枢神经系统中polyA尾的长度在果蝇脑中具有保守性。
基因本体分析显示,具有短polyA尾(<64.45 nt)的转录本异构体在翻译和免疫过程中富集,而具有长polyA尾(>103.57 nt)的异构体在代谢过程以及mRNA和蛋白质加工通路中富集。与酵母、秀丽隐杆线虫、果蝇S2细胞和小鼠细胞系中的研究一致,果蝇头部中具有短中位polyA尾长度的转录本更为丰富。通过nanopolish和tailfindr的对比验证,两种方法的皮尔逊相关系数达到0.99,表明方法间具有高度一致性。
基于长读长测序的果蝇头部m6A甲基化分析
研究团队评估了全长天然RNA异构体中的m6A甲基化情况,这是大脑中高度丰富的RNA修饰。m6A修饰在已知m6A修饰基序(5'-DRACH-3')中被检测到,表现为通过纳米孔的电流强度和时间停留的明显变化。研究发现m6A修饰位点在转录本中可变,在5'UTR和转录起始位点附近富集,与果蝇头部第3天成体的m6A miCLIP分析以及果蝇幼虫脑的m6A RNA免疫沉淀测序分析一致。
为了验证m6Anet预测的m6A位点,研究人员将结果与TandemMod的检测结果进行了比较。虽然在单个m6A位点水平没有重叠,但684个转录本中有618个被两种工具识别为m6A修饰,表明在转录本水平具有高度一致性。
根据平均修饰频率对转录本进行基因本体分析发现,果蝇转录本的平均m6A修饰频率分布偏向高水平修饰,范围从0.68到1.00,中位频率为0.58。高度修饰的转录本在免疫系统过程中显著富集,中等修饰水平的转录本在与突触功能相关的术语中富集,较低m6A水平的转录本在维持稳态的细胞过程中富集。这些分析支持了m6A修饰增加转录本功能多样性的证据。
研究未发现转录本丰度与m6A修饰率之间的相关性,这与之前的研究报告一致。通过将m6Anet m6A位点预测与果蝇头部METTL3敲除对照的miCLIP鉴定结果进行比较,评估了m6Anet的性能。在m6Anet识别的711个基因组m6A位点中,约38%落在METTL3依赖性m6A峰和高置信度预测m6A位点的100 bp范围内,表明尽管存在方法学差异,该分析重现了大量先前验证的m6A修饰位点。
基于长读长测序的果蝇头部转座子编码转录本分析
尽管转座子占果蝇基因组的很大一部分,但其重复性限制了Illumina测序方法识别特定逆转录转座子转录本来源位点的能力。研究人员首先关注了果蝇中经过充分研究的长末端重复逆转录转座子copia。纳米孔直接RNA测序的长读长转录本组装能正确识别负责产生gag蛋白的剪接copia异构体,而Illumina短读长则不能。
鉴于长读长对copia重复元件映射的改进,研究人员扩展了搜索范围以识别其他元件的来源位点。虽然许多逆转录转座子位点表达水平较低,但其他位点的表达水平与果蝇看家基因相当。研究发现DNA、长散在核元件、螺旋环和长末端重复以及卫星序列衍生的转座子在果蝇头部具有转录活性。在这些高表达的转座子家族中,活性长末端重复转座子占主导地位,这主要归因于copia转录本的贡献。
研究发现m6A修饰存在于多个转座子亚家族中,但在copia转录本上特别富集,且在5'UTR偏向性更强。对合并对照果蝇数据中完整copia序列的m6Anet分析计算生成了一个元copia RNA转录本,结果显示m6A修饰在copia转录本上富集,特别是在5'UTR区域。
纳米孔直接RNA长读长测序分析果蝇tauopathy模型
研究人员使用纳米孔直接RNA测序分析了表达人类tau蛋白的果蝇tauopathy模型中的差异转录本表达、polyA尾长度、m6A修饰以及转座子表达/m6A修饰。该模型具有RNA加工缺陷的充分证据,包括m6A修饰、转座子激活、RNA输出改变和无义介导的RNA衰变缺陷。
研究首先识别了FlyBase参考转录组中在对照和tau转基因果蝇之间差异表达的RNA异构体。主成分分析表明样本按基因型分组,样本间显示出高相关性(0.95-0.99),表明样本文库具有高重复性。研究检测到137个差异表达异构体,来自119个基因,表明某些基因编码多个在tau模型中差异表达的异构体。
与之前的分析不同,研究未检测到由于表达致病性tau而引起的全局可变剪接事件的显著变化,如内含子保留和剪接位点的新组合,这可能反映了对大量果蝇头部进行直接长读长测序的需要。为了确定是否可以通过更大的测序深度检测到变化,研究人员合并了生物学重复,并分析了可变剪接事件的变化,重点关注内含子保留。Fisher精确检验显示,tau基因型在合并样本中内含子保留转录本的比例显著更高。
对具有统计学显著性差异polyA尾长度的转录本异构体的分析发现,大多数在tau条件下具有更长的polyA尾。在单分子水平,研究发现每个读段的polyA尾检测变异性在不同读段间可能不同。对tau转基因果蝇中polyA尾长度改变的mRNA进行基因本体分析,发现了参与免疫应答和分解代谢过程的基因。
由于转基因人类tau在果蝇模型中特异性表达于神经元,研究人员随后分析了与神经元相关的基因异构体。虽然与神经元或胶质细胞相关的单个转录本的polyA尾长度没有差异,但研究发现与胶质细胞相关的转录本相比,与神经元相关的一般转录本类别在对照和tau转基因果蝇中都具有更长的polyA尾长度。polyA尾长度、m6A富集和转录本丰度的分析表明,在tau转基因果蝇与对照相比,m6A修饰率与polyA尾长度之间没有显著相关性。
研究团队接下来研究了tau诱导的m6A修饰变化。在4,620个异构体转录本中检测到的8,305个个体m6A基序中,识别出529个转录本异构体带有558个m6A基序,在tau转基因果蝇与对照相比显著不同。对这些差异甲基化RNA异构体的进一步表征显示,353个位点在tau条件下具有显著更高的m6A修饰率,而205个位点修饰率较低。
研究分析了在tau病理背景下改变的DRACH k-mer基序。k-mer AAACT后接GGACA具有最多的高甲基化位点,而AAACT、GAACA和AAACA具有最多的低甲基化位点。差异m6A修饰主要发生在tau转基因果蝇的编码序列和3'UTR中,包括高甲基化位点向3'UTR的转移。研究在tau条件下检测到低甲基化位点的相同趋势。一小部分转录本在tau转基因果蝇与对照相比,在同一异构体内同时表现出位点的高甲基化和低甲基化。
对差异甲基化基因的基因本体分析显示,在tau转基因果蝇大脑中低甲基化的转录本参与受体酪氨酸激酶信号传导和细胞稳态,而高甲基化的转录本参与代谢通路,包括对大脑特别重要的碳水化合物、脂质和大分子代谢过程。未观察到m6A修饰率变化与异构体表达倍数变化之间的显著相关性。
虽然之前的研究已经识别了对照和tau转基因果蝇之间差异表达的逆转录转座子转录本,但由于Illumina测序的局限性,以前无法识别这些元件的来源位点。使用基于纳米孔的差异表达分析,研究人员识别了六个逆转录转座子来源位点,在tau转基因果蝇与对照相比差异表达。在tau转基因果蝇与对照相比显著上调的三个位点中,两个是存在于3R染色体和Y染色体上的copia元件。
研究识别了copia家族内的四个转座子位点,这些位点产生具有差异m6A修饰的转录本。研究发现染色体带40F7上copia元件的低甲基化与tauopathy中表达降低相关,而染色体带4b4-4b5上的copia元件高甲基化且在RNA水平表达增加。这些发现表明,tau诱导的polyA尾延长和m6A变化显著促进了果蝇头部的转录组,并且tau诱导的m6A变化可能有助于RNA水平的转座子失调。
研究结论与意义
本研究首次使用长读长测序分析了tauopathy果蝇模型头部的全长天然RNA,通过在单一长读长测序策略中识别RNA碱基修饰和位点特异性表达的转座子,建立了研究生理和病理状态下转录组的框架。研究发现神经元中致病性tau的表达增加了polyA尾长度、m6A修饰频率和转座子表达,这些变化可能通过增加转录本功能多样性而贡献于神经退行性变。
研究建立的果蝇头部特异性基因表达图谱填补了先前长读长测序研究和标准Illumina RNA测序在果蝇头部研究中的空白,增进了我们对转录后基因表达控制如何影响tau转录组的理解。纳米孔直接RNA测序在转座子生物学中的应用显示出巨大潜力,能够识别特定转座子来源位点,这是短读长测序难以实现的。
尽管纳米孔直接RNA测序在解析复杂转录本方面具有优势,但研究也指出了该技术的局限性,包括相对较低的测序深度、对polyA尾转录本的偏好以及3'测序偏向性。这些因素可能影响了在tau转基因果蝇中检测可变剪接事件的能力。未来研究通过提高测序深度和应用改进的碱基识别方法,有望提供更深入的见解。
总之,这项研究为理解tau蛋白病中RNA加工变化的分子机制提供了重要见解,建立了分析复杂转录组的框架,为未来研究人类阿尔茨海默病和相关tau蛋白病中的tau转录组奠定了基础。纳米孔直接RNA测序技术的应用将推动神经退行性疾病转录组学研究进入新的阶段,特别是在单分子水平解析RNA修饰和复杂转录本结构方面具有独特优势。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号