基于转录组数据驱动推断布尔网络预测细胞分化与重编程的新方法

【字体: 时间:2025年09月27日 来源:npj Systems Biology and Applications 3.5

编辑推荐:

  本研究针对布尔网络模型构建困难的问题,开发了一种整合转录组数据和先验知识自动生成布尔网络集合的通用方法。研究人员利用BoNesis软件,从单细胞和批量RNA测序数据中推断出能够再现细胞分化动态的布尔网络,成功预测了造血过程和脂肪细胞向成骨细胞转分化的关键调控因子,并通过实验初步验证了预测结果。该研究为细胞命运调控机制提供了新的建模框架,在细胞重编程和疾病治疗方面具有重要应用价值。

  
在系统生物学研究领域,理解细胞分化过程和开发细胞重编程策略一直是科学家们关注的重点。布尔网络(Boolean network)作为一类稳健、可解释且具有预测能力的模型,特别适合模拟细胞分化和命运决定过程。然而,构建这样的模型面临巨大挑战,需要整合转录组实验数据和先验知识,涉及成千上万个基因的复杂调控关系。
传统上,布尔网络的构建主要依赖专家知识和手动设计,这种方法不仅耗时耗力,而且难以保证找到所有可能的调控机制。尽管近年来出现了一些从数据推断布尔网络的方法,但这些方法通常难以扩展到数百个基因以上,或者对数据的解释方式有较多限制。因此,开发一种能够从不同类型转录组数据中自动推断布尔网络集合的通用方法具有重要意义。
在这项发表于《npj Systems Biology and Applications》的研究中,Stéphanie Chevalier等研究人员提出了一种整合转录组数据和基因调控网络先验知识的方法,能够自动生成能够再现特定细胞行为的布尔网络集合。该方法基于BoNesis软件,通过逻辑编程和组合优化算法,从模型预期的结构和动态特性规范中自动构建布尔网络。
研究采用了几个关键技术方法:利用BoNesis进行布尔网络的自动合成和验证;使用单细胞RNA测序(scRNA-seq)和批量RNA测序(bulk RNA-seq)数据进行轨迹重建和基因活性二值化;通过CABEAN工具计算细胞重编程的扰动策略;采用Ensemble-MaBoSS进行布尔网络集合的随机模拟;以及进行实验验证包括细胞培养、病毒转导和单细胞RNA测序等技术。
案例研究1:基于scRNA-seq数据的造血作用集合建模
研究人员将推断流程应用于小鼠造血单细胞RNA测序数据,通过轨迹重建和二值化方法推导出分化动态的逻辑规范。利用BoNesis,他们考虑了DoRothEA数据库中参考的TF调控关系,自动识别出能够再现分化动态的最稀疏布尔网络。
研究发现,自动选择的基因与文献中的专家模型有显著重叠:与Hamey等人的模型共享FLI1、GATA1、GFI1B、IKZF1、MYB、RUNX1等6个基因;与Moignard等人的模型共享FLI1、GATA1、GFI1B、IKZF1、MYB、SPI1等6个基因;与Collombet等人的模型共享CEBPA、EFB1、IKZF1、MEF2C、RUNX1、SPI1等6个基因。
模型变异性分析
从提取的TF-TF子网络中,研究人员采样了1000个不同的布尔网络,所有这些网络都符合先前描述的定性动态特性。对采样模型根据函数相似性进行聚类,结果显示三个明显的模型组。值得注意的是,红色簇(A簇)的影响图更为稀疏,每个节点的调节因子较少,因此具有简单且变异性较小的布尔函数。而黄色(B簇)和绿色(C簇)则显示出相当密集的影响图,见证了更复杂的布尔函数。
案例研究2:基于批量RNA-seq时间序列数据的脂肪细胞向成骨细胞转分化集合建模
这个案例研究展示了一个完整的流程,从实验批量RNA测序时间序列数据和TF-TF网络背景知识到转分化遗传突变的预测及初步实验验证。
研究人员使用了两种不同的二值化方法:通过自举参数分布(RefBool)进行基因活性分类,以及通过应用基因特异性截断的简单统计程序(称为MUQ)。总共1560个基因在至少一种二值化方法和一个重复中获得了二进制值。
案例研究2:具有高保真度和效率的重编程目标预测
研究目标是预测基因表达扰动的组合,以触发脂肪细胞向成骨细胞的转分化。使用CABEAN工具计算了导致从AD15状态到OD15状态重编程的瞬时扰动(基因敲除)组合。保留了在至少10%的单独模型中识别出的扰动组合,最终获得了34种不同的2到4个同时扰动的组合。
通过对布尔网络集合的模拟,研究人员定义了评估重编程候选者的分数:重编程效率计算为估计的稳态分布中最终处于具有所有成骨细胞标记基因活跃且所有脂肪细胞标记基因不活跃的状态的模拟比例;重编程保真度采用了完整布尔状态与相应定性解释的二值化状态之间的相似性度量。
案例研究2:节点选择和重编程靶点的文献验证
预测的重编程决定因子中包含的转录因子按频率和最大预测效率进行排名。对预测的顶级TF的相关文献分析揭示了它们与成骨细胞生成调节的现有关联,从而为方法提供了间接验证。
基于预测的组合效率和现有文献证据,选择了三个包含三个决定因子的组合进行实验验证。重编程实验1(RE1)涉及TRP63的上调和CEBPA与SP1的下调;RE2涉及TCF7L2和TRP63的上调以及SP1的下调;RE3涉及TCF7L2的上调以及CEBPA和SP1的下调。
案例研究2:初步实验验证
为了实验测试选择的不同的重编程决定因子组合,研究人员利用慢病毒过表达结合siRNA介导的基因抑制。通过逆转录实时定量PCR(RT-qPCR)确认了TCF7L2和TRP63在未分化细胞中分别过表达8倍和15倍,而针对SP1和CEBPA的siRNA导致其mRNA表达降低了35-68%。
经过测序和数据处理后,基于GFP和/或RFP编码mRNA序列的存在识别转导细胞,并分析了转录组的相对变化。基于Wilcoxon秩和检验(FDR < 0.05)获得单细胞表达数据中的差异表达基因(DEG)。与批量DEG(第15天:脂肪细胞与成骨细胞,调整后p值<0.05)相比,上调的单细胞DEG的精确度对于三个不同的重编程实验RE1-RE3分别为0.57、0.51和0.33。
研究结论表明,该方法在单细胞和批量RNA测序数据的互补案例研究中展示了数据驱动和专家驱动推断布尔模型的实现。方法的本质是明确建模先验知识(通常从数据库提取的TF-TF相互作用)和模型预期特性的规范。这些后者必须反映专家对实验数据的定性解释。
该方法的灵活性有助于比较不同的建模选择和假设。值得注意的是,推断流程在TF尺度网络上是可处理的。通过采用逻辑编程和组合优化技术,研究人员能够自动修剪非必要变量,并识别驱动观察到的动态的子网络。
对于造血作用的建模,通过从数据动态中自动推断的因果网络已经为进一步探索其调控机制提供了途径,可能通过MaBoSS进行模型集合模拟。对于脂肪细胞向成骨细胞转分化的案例,应用的流程产生了有希望的重编程预测,如文献验证所确认的,突出了其在从时间序列RNA测序数据识别新靶点方面的实用性。
总的来说,这项研究提出了一个从知识和数据中推断布尔网络的通用方法,并展示了其在两个重要生物学过程中的应用价值,为细胞命运调控的系统生物学研究提供了新的工具和见解。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号