-
生物通官微
陪你抓住生命科技
跳动的脉搏
全长转录组测序技术鉴定小胶质细胞新异构体!
【字体: 大 中 小 】 时间:2023年12月29日 来源:基因有限公司
编辑推荐:
在这篇文章中,作者利用长读长测序技术来绘制小胶质细胞基因组图谱(isoMiGA),鉴定出35,879种新的小胶质细胞转录本异构体,并借助短读长数据来量化了已知和新型异构体的表达。
小胶质细胞是中枢神经系统的髓系先天免疫细胞,在遗传上与多种神经退行性疾病有关,例如阿尔茨海默病(AD)和帕金森病(PD)。作者之前绘制了人类小胶质细胞基因表达和mRNA剪接的遗传调控图谱,发现使用短读长测序鉴定剪接的遗传效应具有挑战性,因为无法完全识别转录本异构体。短读长RNA-seq依赖于reads的拼接来定义剪接位点,而长读长RNA-seq在单个reads中包含整个异构体,从而能够精确描绘异构体结构,识别参考注释中未出现的新序列以及每个异构体的潜在氨基酸编码序列(图1a)。在这篇文章中,作者利用长读长测序技术来绘制小胶质细胞基因组图谱(isoMiGA),鉴定出35,879种新的小胶质细胞转录本异构体,并借助短读长数据来量化了已知和新型异构体的表达(图1e)。
图1. 以异构体为中心的小胶质细胞基因组图谱(isoMiGA)项目。
长读长RNA-seq鉴定了新的异构体
作者对死后人类大脑纯化的小胶质细胞进行了长读长RNA-seq,利用PacBio CCS(环形一致性测序)模式生成了89,285,858个全长reads,与传统Illumina RNA-seq生成的相应短读样本配对,在25,956个基因中组装了128,436个异构体,其中35,879个是新的异构体,2,238个基因是新基因(未在GENCODE v38中发现)(图2a)。作者对可变剪接进行了分析,发现可变启动子的使用是最常见的剪接事件,与GENCODE参考相比,内含子保留事件非常丰富(图2b)。除此之外,作者还观察到1,725个通读融合异构体,包含由2个或最多6个相邻基因线性拼接在一起的序列。在590个融合基因中,有36个已在先前基因数据库中确定。
图2. 鉴定人类小胶质细胞中的新转录本异构体。
作者使用genemark (v5.1)评估了每个转录本异构体的潜在蛋白质编码能力,以识别ORF。此外,任何在剪接位点后带有终止密码子的异构体都被预测为无义介导的衰变(NMD)。结果显示,不完全剪接匹配的异构体具有最高比例的预测蛋白质编码异构体(82%)(图2c),其次是目录中的新异构体(57%)。短读长与长读长数据之间基因及异构体表达水平高度相关(图2d)。作者在HNRNPK(一种与衰老大脑相关的RNA结合蛋白)中发现了一组新的异构体,它在外显子5和6之间包含一个新的内含子保留事件,导致典型外显子6编码域上游有一个新的起始密码子,同时发现了两个支持典型外显子5-6剪接的肽和两个支持新的上游起始位点的新肽(图2e)。为了证明isoMiGA中发现的转录本异构体多样性,作者还展示了TREM2(图2c)和CD33中发现的同种异构体,这两个基因与AD具有强大的遗传关联。引人注目的是,这两个基因座都含有可检测到的将两个基因连接在一起的通读融合异构体。TREM2/TREML1区域在IsoMiGA中有12个可检测的异构体,其中4个在GENCODE中发现(图2f)。
新异构体功能验证
1. 新的异构体具有刺激、区域和亚型特异性
作者从单个人类供体产生的LRRK2基因中含有帕金森病相关突变(G2019S)的3个等基因系中产生了诱导多能干细胞衍生的小胶质细胞(iMGLs),并用脂多糖(LPS)或干扰素γ(IFN-γ)处理它们24小时(图3a)分别模拟对细菌或病毒感染的反应。作者通过短读长RNA-seq估计了异构体的差异表达,鉴定了2,192个注释基因和75个新基因在IFN-γ处理下差异表达(图3b),而539个注释基因和28个新基因在LPS处理下差异表达。作者进一步检测了13,187种注释异构体和4,589种新异构体的差异异构体使用情况,仅观察到对IFN-γ有显著响应的异构体,其中42种注释异构体和9种新异构体的使用发生了变化(图3c),这些结果表明,本次研究中发现的一些新异构体在炎症反应中发挥作用,可能具有特定的功能。
图3. 在干扰素刺激和脑区之间的差异基因表达和异构体使用。
作者另外研究了四个不同大脑区域纯化的小胶质细胞,发现人类大脑皮层和非皮层区域的小胶质细胞之间存在广泛的区域特异性基因表达和转录物使用差异(图3d),其中来自脑室下区(SVZ)的小胶质细胞尤其明显。新异构体在SVZ中优先下调(图3f),这包括AD风险基因PICALM,4种异构体被差异使用,而新的蛋白质编码异构体MSTRG.12300.16缺乏上游的3个编码外显子,相对于其他异构体,在SVZ小胶质细胞中被下调(图3g)。
2. 新异构体解释GWAS疾病的新共定位
作者发现新异构体促进剪接QTL的发现。他们对来自391个供体的555个短读长RNA-seq样本进行了数量性状位点分析(QTL),形成迄今为止最大的小胶质细胞转录组学队列,鉴定出456个具有eQTL的新基因和5,658个具有tuQTL的新异构体(3545个基因)。
作者尝试应用表达和剪接QTL集来解释疾病遗传性,将小胶质细胞QTL集合与阿尔茨海默病(图4)和帕金森病的个体全基因组重要位点共定位,通过对异构体使用和剪接的影响来确定风险介导的新机制。在阿尔茨海默病中,作者在78个检查的风险位点中确定了32到37个包含共定位表达或剪接QTL类型(图4a),然后将每个位点的最大共定位概率与表达和剪接进行比较,以确定证据是否支持基于表达的机制与剪接机制(图4b)。作者进一步研究了PLGC2位点,观察了基因表达、连接点使用和异构体使用的共定位(图4d)。PLCG2是TREM2的已知相互作用物,与AD风险相关。PLCG2具有常见的风险变体,其先导SNP rs12446759位于典型PLCG2转录起始位点上游,与长链非编码RNA RP11960L18.1重叠(图4e)。在长读长RNA-seq数据中观察到多个通读融合异构体,其中包含来自RP11-960L18.1的序列拼接到PLCG2。GENCODE中的一个异构体ENST00000565054.5共享这些外显子的一部分,但没有延伸到PLCG2的完整编码序列中,而长读长数据发现了包含两个基因全部外显子内容的新异构体。
图4. 新异构体改善了对阿尔茨海默病共定位的解释。
参考文献:https://doi.org/10.1101/2023.12.01.23299073
讨论
总而言之,本文利用长读长RNA-seq建立了人类小胶质细胞RNA异构体数据库,鉴定出35,879种新的异构体和2,238种新的基因,扩大了对小胶质细胞转录组的了解。除了增加潜在的蛋白质编码异构体的数量外,新异构体目录还增加了新的非编码调节异构体类别,如内含子保留、反义和通读融合。对于已被充分研究的AD风险基因CD33和TREM2,文中观察到多个融合异构体高表达。此外,还提供了一个扩展的eQTL和sQTL目录,全面表征了小胶质细胞中基因表达和剪接的遗传调控。
文章认为:长读长RNA-seq有助于在单个测序reads中捕获整个mRNA分子,有望识别新异构体和开放阅读框(ORF)。虽然现在纯粹使用长读长RNA-seq绘制遗传关联图谱是可行的,但更具成本效益的方法是将长读长衍生的异构体信息与短读长的高测序深度和大队列规模相结合。
然而,PacBio新推出了Kinnex试剂盒!!!
Kinnex试剂盒基于MAS-Seq方法,可将较小的DNA片段连接成较长的HiFi可用文库,提高测序通量,使长读长 RNA -seq更具成本效益。
• Kinnex 单细胞 RNA 试剂盒以现有的 MAS-Seq for Single Cell 3' 试剂盒为基础,增加了对 10x Genomics 5' 试剂盒和文库复用的额外支持。
• Kinnex 全长 RNA 试剂盒可进行全长 RNA 测序,信息丰富,样品复用灵活。
• Kinnex 16S rRNA试剂盒可以在任何规模上进行超高分辨率、更高质量的微生物组测序。
现在下单还有更多优惠,详情咨询您身边的基因人~
基因有限公司作为PacBio公司中国区合作伙伴,自2011年以来将PacBio第三代单分子实时测序技术引入国内,一直为国内用户提供专业的三代测序系统的安装培训,技术支持,应用培训与售后维护工作,赢得客户的一致好评与信任。基因有限公司将一如既往的支持越来越多的PacBio用户。
关于基因
基因有限公司成立于1992年,是一家提供生命科学科研仪器、试剂耗材和技术服务的综合服务商。基于“Gene Brightens Every Life • BioTech Connects the World”——“基因燃亮生命 • 生物技术连接世界”的愿景,专注于生命科学领域前沿技术的引进和推广,致力于推动该领域国内科研机构硬件水平及实验方案的革新与升级。同时,公司也一直致力于自主品牌的科研设备的研发与生产,拥有一系列通用性强、互补性高的自主品牌产品。
基因的服务网络遍及全国各地十多个大中城市,拥有包括仪器销售,试剂销售,市场与技术支持,维修,客服,物流等多个部门组成的完整服务体系。
我们希望通过不懈努力,为您的成功铺路搭桥,也为中国的生命科学事业赶超世界先进水平尽一己之力。欲了解更多信息,请访问www.genecompany.cn。