转录组网络中的极端离群基因表达模式揭示"混沌边缘"效应

【字体: 时间:2025年09月10日 来源:Genome Biology 9.4

编辑推荐:

  本研究针对RNA-seq数据中普遍存在但长期被忽视的极端离群基因表达现象,通过多物种(小鼠、人类、果蝇)多组织转录组分析,首次系统证实这些离群表达具有生物学真实性而非技术误差。研究发现离群表达呈现自发、非遗传特性,与激素基因(PRL/GH1)等共表达模块相关,提示基因调控网络可能处于"混沌边缘(edge of chaos)"状态,为理解转录组动态调控提供了新视角。

  

在基因表达研究领域,RNA-seq技术已成为解析遗传网络和疾病机制的核心工具。然而长期以来,数据分析中存在一个被刻意回避的现象——某些样本中会出现极端离群(outlier)的基因表达值。传统观点将这些异常值视为技术噪音,通过数据过滤或统计转换予以消除。但这一做法背后隐藏着关键科学问题:这些看似"异常"的表达模式是否可能反映真实的生物学现象?随着测序技术标准化程度提高,技术误差的可能性已大幅降低,为重新审视这一现象提供了契机。

Chen Xie等研究团队在《Genome Biology》发表的研究,首次系统探索了极端离群基因表达(extreme outlier gene expression)的生物学意义。研究人员收集了小鼠(包括远交系、近交系和三代家系)、人类(GTEx数据库)和果蝇的多组织转录组数据,采用保守的离群值判定标准(Q3+5×IQR,相当于正态分布中均值以上7.4个标准差),发现所有数据集均呈现可重复的离群表达模式。引人注目的是,某些个体在特定组织中会集中出现大量离群基因(被定义为"离群个体"),而同一个体的其他组织却表现正常。通过家系分析证实,大多数离群表达不能以孟德尔方式遗传,在近交系小鼠中同样存在该现象,排除了遗传变异作为主要驱动因素的可能。

研究采用的主要技术方法包括:多物种转录组分析(小鼠5个器官48个个体、人类GTEx数据库51个个体、果蝇2个物种群体样本)、三代家系设计(5个小鼠家系50个个体)、单细胞转录组分析(人类脑组织53个个体15种细胞类型)、技术重复验证(不同建库试剂和测序平台)、共表达网络分析以及人类激素水平纵向追踪(310名女性9-15年间数据)。

离群基因的组织分布特征显示,约18-22%的离群基因会在多个组织中同时出现,但仅少数(小鼠61/565、人类32/908)符合遗传多态性特征。跨物种比较发现小鼠和人类存在929对直系同源离群基因,其中催乳素(PRL)和生长激素(GH1)在两类物种中均呈现共表达特征。值得注意的是,这两种激素基因在脑和心脏等次级组织中的离群表达高度相关,但在主要表达器官垂体中的表达模式却无此关联。

共表达模块分析揭示了离群基因的组织特异性调控网络。如图4所示,心脏组织中钙结合蛋白S100a8/S100a9基因对、分泌球蛋白家族(Scgb3a2/Scgb1a1)等五基因模块;肾脏组织中细胞色素P450家族(Cyp21a1/Cyp11b1/Cyp11a1)等五基因模块;乳腺组织中14个肌原纤维组装相关基因模块等,均表现出协同离群表达特征。单细胞数据分析表明,离群表达不能完全用脉冲式基因表达解释,因为部分基因在所有细胞中均呈现表达升高。

人类激素水平追踪提供了动态视角:在310名女性的9-15年间隔测量中,催乳素离群表达者无一在两次检测中同时出现离群;而在974名女性的月经周期内检测中,部分个体在黄体期和卵泡期均保持较高水平(虽未达离群阈值),提示离群表达可能维持数周时间。这些发现与垂体RNA-seq数据中PRL/GH1的表达变异模式相互印证。

研究结论创新性地提出"混沌边缘(edge of chaos)"理论来解释离群表达现象。基因调控网络作为高度非线性的动态系统,其内部存在的正反馈环和复杂互作可能自发产生混沌行为。这种处于有序与混沌临界状态的特征,使得某些基因模块在特定个体中偶然激活极端表达,而整体网络仍保持稳定。该研究不仅为理解转录组变异提供了新框架,也对医学研究具有启示意义——那些被常规分析过滤掉的"异常"数据,可能蕴含着个体特异性生理状态的重要信息。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号