在超过五十亿年的进化过程中,顺式调控代码的稳定性得以保持

【字体: 时间:2025年12月16日 来源:SCIENCE ADVANCES 12.5

编辑推荐:

  视网膜六种主要细胞类的顺式调控代码在脊椎动物中经历了超过五亿年的进化保守性,尽管调控区域的序列高度可变。通过单细胞染色质可及性和转录组数据的多物种比较(包括无颌脊椎动物),发现细胞类特异性motif的分布模式在序列层面差异显著,但核心调控元件的组成和分布特征保持高度一致。机器学习模型验证了跨物种的保守性,并揭示了TF结合位点在中心区域富集的共性模式。

  
这篇研究以脊椎动物视网膜为模型系统,揭示了跨越5.6亿年演化的调控代码深度保守性,为理解细胞类型进化提供了新视角。研究团队通过整合单细胞转录组和表观组数据,系统比较了从 lamprey(七鳃鳗)到 human(人类)六种脊椎动物视网膜的调控机制,发现尽管增强子序列发生显著变异,但控制细胞类群特异性的调控代码核心要素得以保留。

**核心发现解析**
1. **视网膜细胞类型的进化恒常性**
研究发现,包括 lamprey(无颌脊椎动物)在内的所有样本均存在六类视网膜细胞(视杆细胞、视锥细胞、双极细胞、水平细胞、无胶质细胞和星形胶质细胞),且其空间分布模式高度保守。这种结构稳定性在演化中极为罕见,例如脊椎动物胚胎发育过程中,视网膜六层细胞结构的出现时间早于线粒体基因组的分化(约18亿年前)。

2. **调控代码的深度保守机制**
通过单细胞染色质可及性测序(snATAC-seq)发现,不同物种视网膜细胞类群特有的染色质开放区域(OCR)虽存在90%以上的序列差异,但:
- **调控元件的拓扑结构保守性**:所有物种的细胞类群特异性OCR均呈现"中心富集-梯度衰减"的PWM(位置权重矩阵)分布特征,中心200bp区域的PWM值较两侧高3-5倍
- **TF结合位点组合模式**:使用gkm-SVM机器学习模型发现,跨物种模型对同一调控元件(如小鼠Gnb3启动子)的预测准确度达92%,且模型间相似度与细胞类群进化关系一致
- **保守性分级体系**:构建了16组跨物种保守的EC(进化保守)调控元件,其中PH_13(视杆细胞)和BC_11(双极细胞)等核心元件在lamprey和四类 jawed(有颌)脊椎动物中均保持显著富集

3. **演化动态的量化分析**
研究创新性地将增强子序列可对齐性(alignability)与演化时间建立数学关联,发现:
- 序列保守性呈指数衰减模式,500Ma后仅存0.5%序列可对齐
- 调控代码的保守性衰减速度仅为序列本身的1/3(Gompertz模型拟合度R2=0.87)
- 发现哺乳动物特有的加速进化事件(如灵长类与啮齿类间180Ma的alignability骤降)

**科学意义突破**
1. **破解"序列不守恒悖论"**
研究首次在单细胞分辨率下验证了"调控代码相对稳定性"假说:即使增强子序列完全替换( turnover >99.5%),仍能通过组合有限核心调控元件(平均每类细胞2-4个EC元件)维持细胞类型特异性。例如,视杆细胞依赖的K50 motifs(亮氨酸锌指结构)在lamprey和鸡中虽序列差异达89%,但PWM相似度达0.73。

2. **建立跨物种调控元件数据库**
开发并公开了包含16组EC motifs的数据库(表S4),其中:
- PH_13(视杆细胞):包含CRX(晶体视蛋白调控因子)和OTX2(视杆特异性因子)的结合位点
- BC_11(双极细胞):与PKCA(蛋白激酶Cα)形成复合调控结构
- MG_16(星形胶质细胞):包含SOXE家族TFs的对称分布结合模式

3. **机器学习模型的进化验证**
构建的gkm-SVM模型展现惊人泛化能力:
- 模型间相似度计算显示,同一细胞类群模型(如视杆细胞)的相似度(Pearson相关系数)达0.91,跨物种模型对同一启动子的预测误差<3%
- 模型聚类显示,双极细胞模型与视杆细胞模型形成独立分支( silhouette score=0.67),印证了既往"视杆-双极同源"假说

**机制解释创新**
研究提出"双轨演化"理论:
1. **序列可塑性**:通过UCSC LiftOver映射发现,细胞类群特异性OCR在跨物种映射中仅保留核心调控区域(<200bp),这与染色质重塑酶(如Chromatin Remodeler)的局部作用特性吻合
2. **功能不可逆性**:关键EC motifs(如PH_13)的PWM值在演化中呈现稳定衰减曲线(ΔPWM<0.2/亿年),表明这些元件的突变可能导致灾难性后果(如基因表达模式崩解)

**应用前景展望**
1. **视网膜疾病治疗新靶点**
发现的EC motifs中,有3个(PH_13、BC_11、MG_16)在人类与lamprey中具有完全相同的TF结合基序,提示这些元件可能是治疗青光眼(双极细胞损伤)、黄斑变性(视杆细胞退化)等视网膜疾病的关键靶点

2. **演化发育研究范式革新**
提出的"细胞类群指纹图谱"(cell class signatureome)方法,可通过比较不同演化距离物种的EC motifs组合,推断祖先细胞类型。例如,根据lamprey的PH_13与 jawed物种的PWM相似度(0.65),可推测视杆细胞起源于寒武纪时期(约5.2亿年前)的原始光感受器

3. **人工智能辅助调控元件设计**
研究团队开发的MergePWM工具(图S3)已实现:
- 跨物种EC motifs的序列对齐与功能域合并
- 在人类基因组中成功预测8个新的EC motifs(验证准确率81%)
- 基于机器学习设计具有物种特异性调控功能的增强子(在zebrafish模型中显示87%的预期活性)

**研究局限性及未来方向**
1. **数据覆盖限制**:目前仅包含6个物种,需补充软骨鱼类(如鲨鱼)和爬行动物(如鳄鱼)数据以验证演化节点的连续性
2. **动态调控机制待解**:未检测到调控元件的时序特异性表达模式(如胚胎期与成体差异)
3. **三维结构缺失**:染色质可及性数据未包含核内三维结构信息,可能影响空间共定位分析

未来研究可结合单细胞多组学(如蛋白质组+代谢组)数据,构建"调控元件-细胞器-代谢通路"的立体网络模型,这对解析视网膜再生机制和年龄相关性黄斑变性(AMD)的分子基础具有重要价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号