基于物理信息神经网络(RVINN)的动态转录与转录后调控建模:揭示乳腺癌细胞基因表达调控新机制

【字体: 时间:2025年07月16日 来源:Bioinformatics 4.4

编辑推荐:

  本研究针对基因表达动态调控机制解析的技术瓶颈,开发了基于物理信息神经网络(PINN)的RVINN模型。通过整合mRNA生命周期ODE模型与神经网络框架,实现了转录率(α)、剪接率(β)和降解率(γ)的动态参数估计,成功应用于乳腺癌细胞MCF-7的雌激素(E2)和他莫昔芬(TAM)扰动实验,揭示了转录涟漪效应、共爆发(co-bursting)和缓冲(buffering)等动态现象,为基因组尺度研究转录调控提供了新工具。

  

基因表达的动态调控是理解细胞命运决定和疾病发生的关键,但现有技术面临重大挑战。活体成像技术需要预先插入探针序列,仅能观察有限基因;代谢标记方法如4-硫尿苷(4sU)存在时间分辨率低、细胞毒性等问题。这些限制使得同时观测全基因组尺度下转录与转录后调控的动态过程成为难题。日本爱知县癌症中心研究所(Aichi Cancer Center Research Institute)与名古屋大学的研究团队Osamu Muto等人开发了RVINN模型,通过物理信息神经网络融合mRNA生命周期的微分方程模型,实现了无需特殊实验的动态参数估计。

研究采用三大关键技术:1) 基于ODE的mRNA生命周期建模,将未剪接(U(t))和已剪接(S(t))mRNA的动力学参数α(t)、β(t)、γ(t)构建为时间依赖函数;2) 物理信息神经网络架构,通过自动微分计算ODE残差损失;3) 自适应权重训练策略,平衡数据拟合与参数估计。应用这些方法分析了MCF-7细胞在E2/TAM处理下的时间序列RNA-seq数据,通过TPMCalculator量化内含子/外显子读长。

【模拟验证性能优越】

通过稳态-稳态和振荡两种模拟场景验证,RVINN在转录率(α)估计中达到0.93-0.97的中位相关系数,显著优于INSPEcT方法。如图2所示,模型能准确捕捉九采样点下的基因表达波动,实现参数轨迹的平滑重建。

【揭示基因组协调调控】

分析7866个编码基因发现,E2处理下染色体1区域基因呈现显著的时间同步转录模式(图3A),而TAM处理则表现异质性。在ASB13基因座观察到典型的转录涟漪效应(图3C),其激活延迟与邻近增强子RNA(eRNA)表达相关(图3D)。基因组分析证实,距增强子50kb内的基因表现出更强的转录同步性(图3E)。

【动态缓冲机制解析】

定义转录上调/下调的缓冲基因亚群发现,E2特异性缓冲基因(如AACS)通过同步上调α和γ维持mRNA稳态(图4C)。RBP富集分析显示,E2处理的转录上调组特异性富集CIRBP等34种RNA结合蛋白(图4E),而TAM处理的下调组则富集TIA1/TIAL1等应激颗粒成分(图4G)。

该研究开创性地将物理信息神经网络引入基因调控研究,克服了传统方法依赖预设函数形式的局限。通过揭示增强子介导的基因组协调调控和RBP特异的缓冲机制,为理解乳腺癌激素治疗反应提供了新视角。RVINN框架的扩展性使其有望整合多组学数据,推动基因调控网络的动态建模研究。论文发表于《Bioinformatics》,代码已开源(github.com/omuto/RVINN)。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号