综述:生理学如何解决基因中心论的困境

《Experimental Physiology》:How physiology solves the gene-centric impasse

【字体: 时间:2026年07月03日 来源:Experimental Physiology 3.0

编辑推荐:

  本综述澄清了基因与功能研究中区分关联性与因果性的标准。基因组关联评分(Genomic Association Scores) alone 无法满足这些标准,这也正是人类基因组计划(Human Genome Project)启动时所预期的治愈常见疾病的疗法至今未

  
本综述澄清了基因与功能研究中区分关联性与因果性的标准。基因组关联评分(Genomic Association Scores) alone 无法满足这些标准,这也正是人类基因组计划(Human Genome Project)启动时所预期的治愈常见疾病的疗法至今未能实现的原因。相反,对功能和疾病的因果性理解需要在生物体相关组织层次上获取详细的实验数据,进而通过定量生理建模(Quantitative Physiological Modelling)精确测量因果过程,并将其与关联评分进行比较。研究人员以心脏为例展示这一过程的运作机制,以及相关工作如何促成了一种有效药物的发现。神经系统的研究是另一个具有重大临床意义的领域,因为神经疾病也曾被预期能够通过基因组学驱动的基因疗法发现而获得攻克,但该预期同样未能实现。现亟需探究功能生理组织层次上的因果关系,以制定能够识别多因素疾病治愈策略的方案。
1 引言

研究人员在先前发表于《实验生理学》关于系统生物学原理的文章中识别了基因中心论的困境。本研究旨在阐释该困境的成因,以及生理学如何通过识别病因与疗法来规避这一困境。研究人员首先指出,老龄化人口与医疗预算的统计数据表明,医疗支出已膨胀至即便发达国家也难以承受的程度。人类基因组计划未能解决常见的老年疾病,导致卫生系统承担高昂成本。随后研究人员阐释了该计划未能达成既定目标的原因,这需要借助Nicholas Wald及其合作者三十余年来关于医学筛查统计数学结论的工作进行分析。进而,研究人员展示了功能和疾病状态的生理性因果如何需要动态过程的定量测量,并以心脏起搏多过程分析如何促成安全药物伊伐布雷定(ivabradine)的发现为例进行说明。研究人员使用1992年起搏模型的新计算结果来阐释该药物作为需求限制剂(demand limiter)的作用机制,保护缺血性心脏病患者免于致命性心律失常。CellML库中类似的现有研究可应用于诸多生理学调查领域以识别因果与疗法。文章最后以神经系统为例,展示关联评分研究同样未能识别因果或疗法,此类疾病有时更多是心灵疾病而非单纯脑疾病。最终,研究人员回归至关键事实:分子生物学的中心法则(Central Dogma)既不"中心"也不"教条"的原因。

2 基因中心论困境的成因

基因中心论困境在医疗保健中有两大主因。第一,与人类基因组计划的预期相反,常见致命疾病的治愈方法并未被发现。群体基因组测序虽然产生了基础科学信息,并在法医学、进化生物学及分子生物学数据库编目等领域有所应用,但研究人员发现,除基因组之外的生物学知识尚有许多未知。仅约5%的序列作为蛋白质模板这一发现揭示了基因组在形成无数调控RNA、构建生理功能调控网络中的广泛作用。这些网络由蛋白质、RNA、代谢物、激素、递质、其他信号分子以及包含和约束这些网络的细胞器和亚细胞结构组成,这才是寻找健康与疾病因果之处。

DNA在遗传量化中被过度赋权,因其信息易于数字化表示。四种碱基(C、G、A、T)可被二进制代码替代,每个碱基以2位编码表示,不会损失信息。相比之下,遗传的卵细胞和精子的其余部分需要以模拟信息表示。以分子尺度映射卵细胞时,膜结构的保守分辨率估计所需信息含量即已大于基因组。将一个核苷酸放大至高尔夫球大小,细胞膜将远在数百英里之外。

困境的第二成因是发达国家医疗保健的巨大成功。人们寿命延长,却遭受未能通过分子层面解决的多因素疾病(癌症、心血管疾病和神经系统疾病包括各种痴呆症)的折磨,国家医疗预算被拉伸至难以承受。基因组学虽昂贵,但未能找到老年疾病治愈方法的代价更为高昂。

3 基因组学临床承诺为何未能实现

Nicholas Wald及其合作者的工作表明,期望基因组学实现治愈本就不切实际。人类基因组计划启动时预期老年疾病可能仅涉及少数基因,多基因评分(Polygenic Scores)筛查有望确定最高风险人群并指导预防措施。然而研究发现数百个基因与老年疾病相关,而有效筛查未能实现。

Wald等在1999年英国医学杂志发表的论文中回答了"风险因素何时可作为有价值的筛查检测"这一问题,指出:风险因素必须与疾病有极强关联才能成为有价值的筛查检测,这一点未被广泛认识。即使最高与最低五分之一分位间相对比值(Relative Odds)达到200,对于5%假阳性率,检测率也不超过约56%。因此,全基因组关联研究(GWAS)发现的关联强度需要非常高才能兑现承诺,但事实上90%的关联评分非常低,这解释了多基因评分表现不佳的原因。

多基因评分是将所有关联评分加总的数学便利手段,严格而言是虚构的。在非线性交互系统中,每个基因的关联评分必须依赖于所有其他相关基因和环境,关联因此是评估功能意义的极差方式。基因组学对关联评分的解读使用复杂数据操作以寻找所谓的"因果性",但仅有关联无法揭示因果。即便为零的关联评分也可能隐藏实质性因果——Austin Hill早在1965年就指出了这一问题。吸烟与癌症的关联数据仅在获得支气管上皮组织病理学证据和烟草烟雾中致癌因素发现的解剖学与生理学证据后,才成为有说服力的因果线索。

4 生理学中因果性的形而上学

科学中的形而上学是构造任何因果理论所需可检验假说的基础。焦点在于生物体内实验测量因果性所需的条件,这表现为调控网络组分间相互作用的定量模型,以及这些相互作用发生的结构(膜结构等)知识。

存在两种因果形式:形式因(因果由形式)和作用因(因果由作用)。等待被其他活性组分读取的数据库序列是形式因,即分子组成和形状,这正是DNA序列提供的。膜结构作为约束也属于形式因。相比之下,元件内的运动和形状变化,如膜结合通道蛋白中门的开闭,属于作用因。任何模型都需要同时整合这两种因果形式以求解,从而计算和比较关联与因果。

基因组学仅提供静态关联评分,不使用分子及其他动态组分的微分方程,不指定物理边界条件,甚至不尝试量化生物膜和其他细胞结构的复杂性——而计算表明这些结构的信息含量至少与基因组相当。基因组学 onset仅能进行关联评分的变换,没有因果过程的物理模型,故无法导出物理因果性。

5 生理性因果的实例

霍奇金-赫胥黎方程(Hodgkin–Huxley Equations)是生理学中动态因果模型的经典范例。该模型基于霍奇金循环(Hodgkin Cycle),即膜电位与蛋白通道门控动力学之间的反馈,成功预测了神经传导速度和离子通量,并识别了麻醉剂通过阻断电压依赖性钠离子通道的作用机制。

同样的方法被用于测量心脏起搏节律中关联与因果的差异,结果显示两者之间存在巨大差异,这归因于心脏节律的稳健性(Robustness)。每个过程都有其他过程作为后备,在相关基因缺失或其编码蛋白被阻断时启动。这促成了安全药物伊伐布雷定的发现,用于治疗需要降低代谢应激的患者。从动态建模中还可识别潜在因果(Latent Causation):当阻断某个起搏通道时,其他通道提供的潜在因果作用得以显现。若非这种自然的稳健安全过程,难以想象伊伐布雷定这类药物会被研究其治疗作用。

6 走出基因中心论困境的途径

基因组学几乎已耗尽其产生庞大数据目录和各种关联评分变换的能力,但仅凭其自身无法生成表征动态因果性的生理模型。生理学建模中的形而上学并非纯粹推测,因其导向高度实用的结果:活性因果的识别,这是发现治愈方法的唯一可靠途径。

遵循神经轴突和心脏节律建模的范例,模型需满足以下条件:深入基因产物(蛋白质和RNA)层次,否则无法模拟基因变异/敲除以评估关联评分;必须重现相关表型功能;必须遵从基本物理定律(CellML构造即为此目的,以键合图形式构建的模型可保证满足物理定律);必须识别创造表型的因果因素,揭示可靶向干预以治愈疾病状态的过程。

7 以窦房结节律模型为例的完整过程

正常心律由心脏窦房结区域产生,该区域包含数十万个通过缝隙连接(Nexus Junctions)相互连接的细胞,确保整个结区的协调节律,进而将兴奋传导至心房细胞。各种离子通道的表达水平在窦房结中心和周边之间呈系统性变化:中心最大负膜电位可低至-50 mV,而周边接近心房水平(-75至-80 mV)。鉴于i(f)通道在此整个电位范围内对膜电位高度敏感,该通道的离子电流贡献可从周边的主要去极化电流变化至中心的很小贡献。当该通道产生的电流较大时,去极化更快。用多细胞网络模拟代表这些特征的完整窦房结时,电搏动始于周边并向中心传导(Cai等,1994)。这是意外结果,因为已知完整心脏中兴奋波始于窦房结中心向周边传导,但游离窦房结的实验证实了计算结果。

从工程学角度看,伊伐布雷定是一种需求控制器(Demand Controller),通过在运动期间限制心脏需求来发挥作用。仅靠关联分析无法 pinpoint 这种精巧设计的机制,它仅在表型水平显现。图3展示了Noble等1992年窦房结模型和周边细胞模型,以及伊伐布雷定阻断i(f)通道90%和肾上腺素作用的效果。

8 神经系统研究中的基因中心论困境与第9原理:自我的起源

在Noble和Bourret(2026)更新系统生物学原理的文章中,研究人员省略了最后两个原理(第9和第10),因为第1-8原理涉及生物体多物理组织层次间的相互作用,可给予纯物理解释;而第9原理"自我不是客体"则暗示非物质的相互作用。神经系统疾病的研究突显了第9原理的重要性。

精神分裂症在家族中流行故曾被预期可由遗传学解释,但截至2024年,尽管美国国立精神卫生研究所(NIMH)花费近80亿美元追求此目标,未能发现任何可与精神分裂症因果关联的单个基因,研究也未产生治疗改进。Torrey(2024)总结道:没有证据表明缺陷基因导致精神分裂症。与几乎所有人类疾病一样,风险基因已被发现并在临床表达中起作用,但它们不导致疾病。

那么什么解释了家族聚集现象?答案是社会剥夺(Social Deprivation),这同样常在家族中流行。Jester等(2023)的广泛研究表明:儿童期虐待、父母精神病理、父母沟通问题、欺凌、低社会经济地位的城市环境是精神分裂症谱系精神病性障碍发病率和/或健康状况恶化的主要风险因素;社会网络规模与整体精神病理和阴性症状呈负相关;种族/民族歧视经历与精神病性症状和经历 prevalence 相关;与本地人口相比,移民、难民和寻求庇护者的精神病风险更高;社会碎片化与精神分裂症患病率增加相关;无家可归人群的精神分裂症患病率是普通人群的30倍。

因此,精神分裂症和阿尔茨海默病等神经疾病更应被视为心灵疾病。在最严重形式中,它们严重影响自我感,从而贬低其价值和幸福感,使个体丧失能力。

9 第10原理:还有更多待发现

这并非系统生物学的专属原理,而是适用于所有科学的原则。研究人员必须对实验结果保持开放。在生命起源层面,RNA聚合酶核酶(Ribozyme)可催化并复制,仅45个核苷酸即可实现,Gianni等(2026)研究了能复制多种不同RNA模板(包括具有紧密折叠二级结构和编码锤头核酸内切酶核酶的序列)的QT45。在动力学动态层面,需要分析连续瞬时动力学,这应是纵向转录组学(Longitudinal Transcriptomics)的正常延续;蛋白质组学分析对预测基因功能更为重要。在复杂分子合成层面,DRT3b组分可合成自身及其互补链,蛋白质本身作为DNA的模板。在胚胎发育层面,早期基因组组织由重叠但可分离的调控输入协调,这在合子基因组激活之前即已出现。在群体层面,选择的方向性在过去10,000年间影响了数百个等位基因。

Deng等(2026)的结果挑战了中心法则中看似稳固的部分。研究人员在Noble和Bourret(2026)图1中增加了从蛋白质到细胞质DNA的箭头,因为他们的结果显示了功能性DNA的形成使细菌能够中和噬菌体,但未必编辑遗传DNA。

10 DNA序列的句法学不能揭示语义学

在关联与因果的区别之上,还存在句法学(语法)与语义学(意义)的区别。沃森和克里克未能区分"密码"一词的隐喻意义和字面意义,导致了DNA化学序列可被视为"生命之书"、创造生物体的"密码"的观念。他们忘记或故意忽略了句法学与语义学的区别。一个可能原因是他们跟随薛定谔(1943)假设DNA是完美准确的自我复制者,从而无法想象活细胞可以改变基因组序列。

没有活细胞及其协调的一套剪切粘贴酶的帮助,G2步骤(使细胞分裂时将高度准确的DNA拷贝传递给子细胞)永远无法实现。这一错误还导致雅各布和莫诺(Jacob and Monod, 1961)将DNA比作包含创造生物体计算机代码的程序。然而,该类比具有深刻误导性,因为完整的活细胞是类比成立的必要条件——这相当于期望计算机自身生成并运行启动它的代码。DNA alone 不能用于创造生物体,它需要卵细胞来完成。计算机需要其操作系统。

DNA是被动的化学物质,而非主动的。其序列需要被活细胞读取以形成化学活性分子RNA和蛋白质。读取DNA序列以创建RNA的过程即为转录。

Lily Kay(1993, 2000)广泛研究了描述DNA及其转录所用语言的发展历程。遗传学家最初认识到"密码"(code)和"程序"(program)的隐喻使用而加上引号,但沃森和克里克(1953)首次去掉了这些至关重要的引号。1958年克里克制定其中心法则时,不仅去掉了引号,还呈现从RNA到蛋白质的箭头是不可逆的,从而暗示生物体无法改变其DNA。他的图示从不包括来自功能网络的向下因果(Downward Causation)。同时假设遗传物质如"晶体"般忠实复制,使中心法则被广泛理解为禁止此类变化。

雅各布·莫诺"并非信息话语的天真参与者。充分意识到数学通信理论的一般特征——其范围和限制——他知道在该领域内信息纯粹是句法的,没有语义价值"(Kay, 2000: p. 220)。1959年4月他给布伦纳的信中写道:"核复制以及蛋白质合成都受到细胞的严格调控"(Kay, 2000: p. 224)。

这种将"信息"不必要地限制于核苷酸的做法也与生物体的化学和物理学无关。那些核苷酸序列由生物体在其所有重要过程的背景下解读。曾经在海洋 creature 中"编码"鳍和鳍状肢的序列最终被用于"编码"陆生肢体。即便"编码"一种蛋白质如顺乌头酸酶,也不能确保相同功能——这取决于该蛋白是在游离溶液中作为酶起作用,还是在细胞膜中作为离子通道起作用(Ball, 2023: pp. 151–152)。是生命本身以其接收的所有多种形式解释信息。来自卵细胞的其余遗传对胚胎发育是必要的。

文本间性(Intertextuality)是描述一种文本(核苷酸序列)与另一种文本(氨基酸序列)之间关系的正确术语(Kay, 2000: p. 283)。DNA不是用于解密蛋白质序列的密码,反之亦然。用"密码"一词描述这种文本间关系是试图发明"密码的密码",没有这种表达的定义。此外,没有理由将DNA单独挑为唯一遗传信息载体——所有有序实体(碳水化合物、蛋白质、核酸——还可加上膜结构)都包含信息。分子遗传学家将核酸单独挑出作为信息属性的独特载体,信息作为意义和商品,逐渐成为DNA作为"主分子"特权地位的隐喻;抽离其技术内容后,它实际上成为隐喻的隐喻,没有所指能指(Kay, 2000: p. 127)。

这种对生物学语言的仔细分析是否重要?是的!基因中心论生物学家对信息理论语言的误用,不可避免导致了基因中心论的困境,承诺了远超可交付的成果。"基因组愿景是简单的,承诺了远超合理范围的更多东西"(Kay, 2000: p. 326)。

11 讨论

通过进一步分析基因组关联评分无法走出医疗保健中的基因中心论困境,因为关联研究不测量生物功能的相关动态和静态原因。动态原因包括所有组织层次的生理相互作用;静态原因包括这些动态原因运作的解剖和组织约束。关联研究也无法检测潜在原因,即使零关联评分也可能隐藏重大潜在因果性。

分子生物学对信息理论语言的误用(Kay, 2000精确 pinpoint),以及基因组学对Wald等同事关于成功筛查标准的数学逻辑的忽视,已将理解推迟了至少30年——不可避免的结论是生物学必须回归表型生理学研究以避免导致基因中心论困境的昂贵错误。Kay和Wald工作的警告在1990年代中期已十分明确。

这是对生物学界的一般性呼吁,迫切需要认识到人类基因组计划明确陈述但同样明确无法达到的目标的失败。研究人员将不得不教育全新一代生物学家,使其理解动态生理过程如何测量,以及它们如何能在治疗老龄化人口中主导健康不佳的多因素疾病中导致重要的临床发现。研究人员概述的前进道路是:足够准确地测量动态和静态原因以构建基于实验的动态模型,然后用于探索干预的可能治疗效果。研究人员对药物伊伐布雷定作用的新数值分析说明了如何随后识别致命疾病的有用治愈方法。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号