基于动态可观测性理论的生物标志物发现新范式:从基因组学到神经科学的跨学科应用

【字体: 时间:2025年10月08日 来源:Proceedings of the National Academy of Sciences 9.4

编辑推荐:

  本综述系统阐述了动态传感器选择(DSS)理论在生物标志物发现中的革命性应用。通过将工程领域的可观测性理论(Observability Theory)与多组学数据(转录组、Hi-C)及神经信号(EEG)相结合,文章提出了动态优化传感器配置的创新框架,解决了传统生物标志物研究在时间分辨率、系统维度和状态依赖性方面的核心瓶颈。该研究为农业监测、生物制造和神经系统疾病诊断提供了精准监测新方案。

  

Significance:生物系统监测的范式转变

现代生物技术虽能实现高分辨率系统监测,但生物信号的解读仍是核心挑战。研究通过引入工程领域的可观测性理论,建立了从实验数据中识别时间依赖型生物标志物的通用方法。该技术在生物医学基因组学、脑电图和内窥镜成像等场景的成功验证,标志着生物标志物发现从静态筛选向动态优化的范式转变。

Abstract:理论框架与跨领域验证

研究团队建立了基于可观测性理论的生物标志物选择通用方法论。通过分析时间序列转录组数据,证明可观测性能识别具有生物学意义的传感器。针对生物系统特有约束,创新性提出动态传感器选择(DSS)方法,确保在系统自身动力学变化时仍保持可观测性。该框架成功扩展到多模态数据整合应用,包括联合使用转录组和染色体构象数据,并通过神经活动电影和脑电图数据验证了普适性。

1. Preliminaries:可观测性理论的教学基础

经典的可观测性矩阵秩条件(rank(O(x))=n)在实际生物系统中面临数值计算挑战。以裂殖酵母DNA复制模型(Tyson-Novak模型)为例,虽然符号计算显示系统完全可观测,但实际数据的奇异值谱分析揭示矩阵处于近似低秩状态(σk1→0)。这促使研究者采用分级可观测性度量标准:
  • M1:观测矩阵秩(适用LTI/LTV/非线性系统)
  • M2:能量度量(x(0)TGox(0))
  • M3:能见度度量(trace(Go))
    这些度量为应对生物数据的高维性和噪声特性提供了数学基础。

1.1. Observability Metrics:度量体系的建立

针对线性时不变系统(LTI),通过李雅普诺夫方程构建观测性Gram矩阵Go,其特征值分解可提取系统可观测方向。对于非线性系统,采用经验观测性Gram矩阵和数据驱动方法,有效解决了传统代数条件在生物系统中的适用性问题。

2. Motivating Problem:生物标志物选择的现实挑战

2.1. Sensor Selection Problem:优化问题的形式化

生物标志物选择被形式化为带约束优化问题:maxsensors M s.t. experimental constraints。通过贪婪算法在Tyson-Novak模型中的实施,发现G1R、G2R、PG2R、UbE和mass五个变量即可实现有效观测,证明了"少即是多"的传感器选择原则。

2.2. Biomarker Observability Depends on Biological State:状态依赖性的数学本质

研究通过PIP-FUCCI细胞周期监测系统和安德罗诺夫-霍普夫(Andronov-Hopf)振荡器模型,揭示了生物标志物效用与系统动态状态的深刻关联。当参数α从负值转为正值时,系统从"数学死亡"(稳定态)转向"数学存活"(周期振荡),观测性度量M3提升达103倍。这一发现为理解细胞周期特异性标志物(如G1期CDT1、S期PCNA、S/G2/M期GEM)提供了理论解释。

3. Results:方法论的应用验证

3.1. Dynamic Sensor Selection (DSS):时间维度上的优化

针对生物系统时变特性,提出了动态传感器选择框架:maxsensors(t) M s.t. constraints at time t。通过构建时变观测性Gram矩阵Go(t0,t)=∑k=t0tΦ(t0,k)TC(k)TC(k)Φ(t0,k),实现了对线性时变(LTV)系统的传感器优化配置。

3.2. Estimating Unmeasured Genes:基因表达预测的验证

在Pseudomonas fluorescens SBW25细菌的600个基因时间序列数据中,DSS方法相比固定传感器策略,将基因表达估计误差降低50%以上。通过最小二乘估计器x?=O?Y成功重建未测量基因表达谱,证明了方法在实际生物系统中的有效性。

3.3. Functional Observers for Cellular Reprogramming:细胞重编程监测

应用功能可观测性理论于Weintraub细胞重编程实验数据,建立了针对成纤维细胞向骨骼肌细胞转分化的监测系统。通过对19,235个基因构建LTV模型,发现重编程相关基因(如MYOD靶基因)在观测性矩阵的右奇异向量中显著富集,功能分析显示这些模式与细胞周期调控(GO:0051726)和平滑肌细胞增殖(GO:0048661)等生物学过程高度一致。

3.4. Chromatin Informed Biomarkers:染色质结构的约束整合

创新性地将Hi-C染色质构象数据作为约束条件引入优化问题:maxsensors(t) M s.t. at most one gene measured per cluster at each time t。通过层次聚类和轮廓系数优化生成的染色质空间集群,确保了选择的生物标志物在基因组空间分布上的合理性,同时保持观测性能不显著降低。

3.5. Beyond the Genome:神经科学的扩展应用

在体内单细胞内窥镜神经信号分析中,发现不同代谢状态(喂食、禁食、再喂食)下神经元观测性贡献发生显著重分配。在脑电图(EEG)研究中,64个导联在不同任务状态下表现出显著不同的观测性特征,特别是在开眼与闭眼条件间存在明显差异,证明了DSS在神经系统监测中的实用性。

4. Discussion:研究展望与未来方向

研究建立了可观测性理论与实验生物学间的桥梁,但仍有多个方向值得探索:控制理论与观测性的对偶关系在干预策略设计中的应用;针对转录组学数据特性设计专用状态观测器;整合多模态数据的细胞状态空间表示;以及Smale双细胞系统等理论模型中的分岔可观测性研究。这些方向将推动闭环生物系统和精准医学监测策略的发展。

5. Materials and Methods:数据与方法

研究使用了公开的RNA-seq(人类和P. fluorescens SBW25)、Hi-C(人类)和神经数据集,所有分析均通过Python和MATLAB实现,代码开源提供。采用标准线性代数函数(如numpy.linalg.svd、numpy.linalg.eig)实现核心算法,确保了方法的可重复性和普适性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号