
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于最优传输理论的单细胞数据动态基因调控网络推断方法GRIT及其在帕金森病突变研究中的应用
【字体: 大 中 小 】 时间:2025年07月13日 来源:Bioinformatics 4.4
编辑推荐:
本研究针对单细胞技术产生的海量数据难以有效解析基因调控网络(GRN)的难题,开发了基于最优传输理论(OT)的GRIT算法。研究人员通过建立线性微分方程模型,利用OT成本函数追踪细胞群体分布演化,成功实现了从单细胞时序数据中推断基因调控网络,并应用于帕金森病相关突变(LRRK2-G2019S和PINK1-I368N)的靶点识别。该方法在BEELINE基准测试中表现优异,为单细胞数据分析和疾病机制研究提供了新工具。
在系统生物学领域,解析基因间的调控关系一直是理解生命过程的核心问题。传统批量转录组技术只能提供细胞群体的平均表达谱,掩盖了细胞间的异质性。随着单细胞RNA测序(scRNA-seq)技术的突破,研究人员现在能够获得单个细胞的基因表达谱,为研究细胞命运决定和疾病发生机制提供了前所未有的机会。然而,单细胞技术也带来了新的挑战:测量过程具有破坏性,无法追踪同一细胞的时间变化;数据呈现高维度、高噪声和稀疏性等特点;现有分析方法大多基于相关性而非因果性,难以揭示真实的调控关系。
针对这些挑战,卢森堡系统生物医学中心(University of Luxembourg)的研究团队在《Bioinformatics》发表了创新性研究成果。他们开发了名为GRIT(Gene Regulation Inference by Transport theory)的新方法,将最优传输理论(Optimal Transport, OT)与动态系统建模相结合,实现了从单细胞时序数据中推断基因调控网络。该方法通过建立线性微分方程模型dx(t)=(Ax(t)+b)dt+√εdw(t)描述细胞状态演化,利用OT成本函数最小化观测与模拟细胞分布间的差异,同时采用前向-后向贪婪算法进行变量选择,最终获得高置信度的调控网络预测。研究还证明了该方法在离散时间线性系统下的理论一致性,即当数据来自真实系统时,GRIT能够唯一识别出真实参数。
关键技术方法包括:(1)基于最优传输理论的细胞分布匹配算法;(2)线性微分方程模型的参数估计;(3)前向-后向贪婪算法进行变量选择;(4)使用BEELINE基准数据集进行方法验证;(5)应用在LRRK2-G2019S和PINK1-I368N突变的人iPSC分化数据集分析。
理论验证结果显示,GRIT在离散时间线性系统下具有理论保证,当细胞数量趋于无穷时能准确恢复真实系统参数。在模拟数据测试中,GRIT在连续时间系统、非线性系统(Michaelis-Menten动力学)和含隐藏状态(模拟蛋白动态)的系统中都表现出色,特别是在分支动态系统中优势明显。在BEELINE基准测试中,GRIT在合成数据集上表现最佳,在BF、BFC和TF等具有分支动态的系统中显著优于其他方法,在LI和CY系统中接近完美预测。
应用研究方面,GRIT成功识别了帕金森病相关突变LRRK2-G2019S和PINK1-I368N的潜在靶基因。在LRRK2突变中,CLU、NEAT1、GNG11、SAT1等基因被预测为高置信度靶点,通路富集分析显示线粒体呼吸链相关基因显著富集,这与已知的LRRK2影响线粒体功能的发现一致。在PINK1突变中,MKI67、ELAVL4、DDX5等基因被识别,富集分析显示多巴胺能突触和心肌细胞肾上腺素信号通路相关基因显著富集。这些发现为理解这两种突变导致帕金森病的分子机制提供了新线索。
研究结论部分强调,GRIT将最优传输理论与动态系统建模相结合,为单细胞数据解析提供了新的分析框架。与现有方法相比,GRIT具有几个独特优势:(1)基于微分方程模型,能够捕捉基因调控的因果性而非相关性;(2)自然扩展到扰动靶点识别和突变效应分析;(3)在模拟数据中表现优异,为未来技术进步后的应用奠定了基础;(4)获得的传输矩阵可用于谱系追踪,类似于Waddington-OT方法但具有模型指导的优势。研究人员也指出当前局限,如对时间分辨率敏感,在真实scRNA-seq数据中性能仍有提升空间。
这项研究的重要意义在于:(1)开发了首个将最优传输理论与动态系统建模相结合的GRN推断方法;(2)为单细胞时序数据分析提供了新的理论框架;(3)发现了帕金森病相关突变的新潜在靶点;(4)为复杂疾病的机制研究提供了新思路。随着单细胞技术的进一步发展,GRIT这类基于动态建模的方法有望发挥更大作用。未来研究可望在多个方向延伸,如结合RNA速度信息、整合多组学数据、引入细胞间相互作用等,进一步推动单细胞系统生物学的发展。
生物通微信公众号
知名企业招聘