
-
生物通官微
陪你抓住生命科技
跳动的脉搏
长读长直接RNA测序揭示E2调控转录组复杂性:从异构体发现到截短蛋白的功能与临床意义
【字体: 大 中 小 】 时间:2025年09月24日 来源:RNA Biology 3.4
编辑推荐:
本刊推荐:本研究采用纳米孔长读长直接RNA测序(DRS)技术,结合3'端测序和深度学习蛋白质建模,首次系统揭示了雌激素(E2)调控下转录组的复杂异构体景观。研究发现内含子多聚腺苷酸化(IPA)事件产生的截短型TLE1蛋白虽缺失WDR相互作用结构域,但通过保留的Q结构域维持二聚化能力,进而干扰ERα介导的转录调控网络(如TFF1、GREB1表达抑制)。临床分析显示TLE1-IPA/FL异构体比率降低与ER+乳腺癌患者不良预后显著相关,为乳腺癌治疗提供了新的潜在靶点。
引言
17β-雌二醇(E2)作为最强效的循环雌激素,通过结合雌激素受体α(ERα)调控细胞增殖、分化和存活相关基因的转录。尽管微阵列和常规RNA测序已识别大量E2靶基因,但其短读长特性限制了对复杂转录结构的解析。长读长直接RNA测序(DRS)技术能够跨越多达49 kb的完整转录本,为全面解析转录组结构提供了突破性解决方案。
方法
研究采用激素剥夺的MCF7细胞模型,分别给予100 nM E2处理45分钟、3小时和12小时。通过牛津纳米孔技术(ONT)DRS生成约100万条读长,平均读长1.1 kb,并使用FLAIR算法进行高可信度转录本鉴定。辅以QuantSeq 3'-测序(3'-seq)、RT-qPCR、蛋白质结构建模(AlphaFold2)和功能实验进行多维度验证。
结果
非编码RNA的E2调控
DRS捕获的转录本中94%属于蛋白编码基因,4%为长链非编码RNA(lncRNA)。E2处理初期(45分钟)呈现显著上调基因爆发,12小时后下调基因数量增加。研究发现728个E2调控的lncRNA,其中lncGATA3–7(LNCipedia编号ENST00000456526.1)经RT-qPCR验证在E2刺激下显著下调。这些非编码RNA富集于凋亡信号传导和腺体发育等癌症相关过程。
剪接异构体多样性
外显子跳跃(ES)和内含子保留(IR)是主要可变剪接形式。ES事件在注释和非注释转录本中均占主导,而IR更常见于非注释转录本。典型案例如CRB3基因的IR异构体(与乳腺癌干细胞性和他莫昔芬耐药相关)和HAGH基因的ES异构体(参与谷胱甘肽生物合成)。功能富集分析显示这些异构体涉及代谢过程、蛋白结合和核苷酸结合等分子功能。
转录本3'端复杂性
通过整合DRS与3'-seq数据,发现3054个转录本终止于末端外显子(TE),413个为内含子多聚腺苷酸化(IPA)转录本(其中246个未注释)。IPA转录本进一步分为早期内含子(EI)和中期内含子(MI)终止类型。EI和MI转录本源自更长的基因(p < 0.0001),且绝大多数含保守多聚腺苷酸化信号(AAUAAA及其变体)。研究排除了位于Alu元件附近(-100至+100 bp)的潜在内部引物干扰区域。
关键IPA异构体的功能验证
重点解析了GREB1和TLE1的IPA异构体:
GREB1-IPA终止于第7内含子,编码缺失糖基转移酶(GT)结构域的截短蛋白
TLE1-IPA终止于第6内含子,编码200个氨基酸的截短蛋白(全长770aa),保留N端Q结构域(介导二聚化)但缺失WDR相互作用结构域
RT-qPCR和3'-RACE证实这两种IPA异构体具有与全长转录本相当的mRNA半衰期。单细胞RNA测序数据(GSE75688)和微阵列探针(228284_at)均验证其广泛表达于乳腺癌细胞。
临床意义与生存分析
TCGA数据分析显示TLE1-IPA(ENST00000376463.2)与全长转录本(ENST00000376499.7)表达呈正相关。值得注意的是,LumA型乳腺癌患者中TLE1-IPA/FL比率降低与更差的无复发生存显著相关(HR = 0.35, p = 0.042;KM-plotter数据库验证HR = 0.65, p = 0.0024)。
蛋白质结构建模与功能实验
AlphaFold2预测表明TLE1截短蛋白通过保守的L26和I29残基维持二聚化能力。Western blot和免疫细胞化学证实Flag标记的截短蛋白(25 kDa)可在细胞核内形成二聚体。功能实验显示,过表达TLE1截短体显著抑制E2诱导的TFF1和GREB1上调(p < 0.001),证实其通过破坏WDR结构域依赖的蛋白互作(如FOXG1/EH1 motif结合)干扰转录调控网络。
讨论
本研究通过长读长测序技术揭示了E2调控转录组中此前未被充分认识的复杂性层面:
IPA事件产生的截短蛋白可能通过显性负效应调控信号通路(如TLE1缺失WDR结构域)
异构体比率(IPA/FL)的平衡具有临床预后价值
内部多聚腺苷酸化信号和pre-mRNA加工延迟可能构成新的转录调控机制
研究局限性包括长读长测序的错误率较高和蛋白质异构体检测的技术挑战。未来需开发异构体特异性抗体以深入探索功能机制。
结论
综合多组学方法证实,E2调控的转录组复杂性远超既往认知。内含子多聚腺苷酸化产生的截短蛋白不仅拓展了蛋白质功能多样性的理解,更为ER+乳腺癌的精准治疗提供了新的生物标志物和干预靶点。
生物通微信公众号
知名企业招聘