
-
生物通官微
陪你抓住生命科技
跳动的脉搏
发现一种比基因层次更高的遗传信息
【字体: 大 中 小 】 时间:2009年08月17日 来源:网络
编辑推荐:
本文所说的这种遗传信息,与基因不同,是另外一种类型的遗传信息。是遗传信息的一个大类。在高等生物,其信息量可能远远超过所有结构基因的信息量的总和。在细胞核的全部DNA序列中,可能正是它们占有其大部分位置。这种遗传信息存在吗?试看,细胞的基因表达,在任何时候,基因的表达都是选择性的。在任何时候,基因表达都是一小部分。试问:是什么样的机制决定了基因的选择性表达?所谓“选择”就是一种控制。要控制就得有调控信息,或者说得有控制指令。本文所说的就是这种控制指令信息。
现在要问,所说的这种遗传信息比基因层次更高,是什么意思?所谓比基因层次更高是说,这种遗传信息是用来控制基因的选择性表达的。细胞的基因表达,例如,在一个细胞分化过程中,要选择哪些基因出来表达,在时间上如何安排,哪些先表达,哪些后表达,表达的先后顺序,都由这种控制指令来决定,来控制。在基因表达过程中,它处于更高的层面。
控制指令存在的必然性
这种基因表达的控制指令存在吗?我们先来看,每一个基因,表达还是不表达,何时表达,是不是由每一个基因自行决定的。细胞的生命活动都是高度有序的,基因表达也不例外。假如每一个基因都能够自行决定其自身是该表达还是不该表达,众多基因的活动就必然杂乱无章。细胞就无法开展它的生命活动。假设有基因表达杂乱无章的现象存在,也是与细胞的生命活动高度有序这一客观事实不相符合的。所以,在任一时刻,哪些基因该表达,哪些基因不该表达,必定接受了一种统一的控制。有一种控制机制存在,有一个基因调控系统存在。要启动某个基因的表达,就必定有一个启动信息,或者说是一个控制指令。否则,基因怎么知道它自己是不是应该启动表达?要选择一系列基因出来表达,就需要有一系列指令,才能启动。这就是控制指令存在的必然性。这一系列指令,就是本文所说的比基因层次更高的遗传信息。
控制指令的信息发现了
第一个例子,非洲爪蟾。非洲爪蟾卵母细胞的成熟与核酸合成的时间顺序,以及非洲爪蟾胚胎初期发生时DNA和各种RNA的合成时间顺序表明,基因的开启表达是有序进行的,相关基因的表达都是有明确的顺序性[1] 。
第二个例子是果蝇的多线染色体。这是一个明确可见的例子,可以看见基因的顺序性表达。果蝇的多线染色体,在果蝇个体发育的某个阶段,某些带区变得疏松膨大而形成胀泡。用标记方法检测,发现这些胀泡是基因活跃转录的部位。因此,胀泡的出现和消失直接反映了基因转录的活性谱[2]。这些研究为关于细胞内的活性化与非活化基因状态的观点,提供了卓越可见的证据。不仅如此,这些胀泡在染色体上的位置,在细胞分化过程中,还出现依次序地有规则地逐步变化。剑桥大学的Micheal Ashburner提供的8幅显微照片(见下图)展示了黄猩猩果蝇的唾腺细胞在分化过程中,巨型染色体同一部分的区带上呈现出胀泡依次序地有规则的逐步变化[3]。这种变化一小时一小时地发生着,一些区带膨大,复原,然后又可以膨大。这就是单一种类细胞分化过程中基因活性顺序型式的可见证据[3]。
引自 John W.金布尔著:细胞生物学,陈立滇 等译,北京:科学出版社,1983年出版。
书中第237页,所发表的照片
这些明确可见的证据表明,在细胞分化过程中,多线染色体上的基因并不是同时表达的,而是有所选择的。而且,基因的选择性表达有一定的顺序。这正如一个应邀演出的戏班子,他们可供演出的折子戏,可以有很多很多的剧目,你点哪一折戏,他们就演哪一折戏。把点出来的若干个折子戏,上演的前后顺序加以编排,就形成节目表。依照节目表上演,就构成了节目的选择性的、顺序性的上演。每个基因都好比是一折戏,你点到它,这一折戏就演出来。你依照什么顺序来点,它就按照什么顺序来演出。果蝇多线染色体所展示的基因顺序性表达,在这8幅照片所显示的时间段,有哪些基因在顺序性表达,可以列出一个“基因表达顺序表”。如果每一个基因的表达都可以看成一个上演的节目,我们所列出的基因表达顺序表,就可以说是一个“基因表达节目表”。从果蝇多线染色体的8幅照片上,我们看到了基因表达的节目表。当然,这个节目表还只是一个片段。完整的节目表,必须从这个基因表达过程的起始,就进行记录,一直记录到这个基因表达过程的结束。
从这个“基因表达节目表”我们看到了什么?我们发现了控制基因选择性表达的指令信息。为什么这么说?基因表达是一个控制过程,这与舞台戏剧演出的控制过程相似。假如有一台戏剧歌舞晚会,这个晚会的演出是由多个独立节目组成的戏剧歌舞晚会。要上演哪些具体的节目,演出的顺序如何,必定要编排一个节目表。舞台指挥者和所有的演员、职员都必须遵循这个节目表来办事。各个节目演出的先后次序怎么遵循?节目表成为最原始、最权威的控制依据。成为核心的控制信息。舞台指挥者是依据节目表来发出指令。有多少个节目上演,就要发出多少个指令。晚会节目演完,他就要发出一系列指令。假如我们处在舞台之下,这一系列指令,我们能看到吗?能听到吗?都不能。我们研究细胞的基因选择性表达,其生理生化过程极为复杂,许多具体过程都是非直观化的。犹如我们观看这台戏剧歌舞晚会,我们只能在台下来观看。它藏在幕后的节目表我们看不到,舞台指挥者命令哪个节目先演,哪个节目后演的指令信号,我们也听不见,看不到。但是节目陆续上演以后,哪些节目演出了,演出的顺序如何,我们在台下却可以观察到,并且可以把这些观察记录下来,得到一个节目表。这个节目表与藏在幕后的节目表相比较,从所记载的信息来说是一模一样的。因为这是演戏的过程中表达出来的信息。舞台控制的核心信息(幕后的节目表),我们就间接地观察到了,也记录到了。同时,舞台之下观察记录到的节目表,也是舞台内部指挥者在整个演出过程中,发出的一系列指令信息的记录。果蝇多线染色体的8幅照片上,我们在外部看到的基因表达的节目表,也就成为在内部基因调控系统所发出的一系列控制指令信息的记录,也成为深藏在基因调控系统内部书面写好(例如在DNA序列上写好)的节目表的信息记录,就像藏在舞台幕后的节目表一样。所以说,我们从果蝇多线染色体的8幅照片上,我们发现了一系列控制基因选择性表达的指令信息的记录。这就是本文所说的发现。
程序
为了理解和认识这一系列指令信息,我们引入“程序”概念。程序由按顺序排列的一些指令组成。什么是指令?指令就是指定进行某种操作的命令。什么是程序?为了完成某种任务,往往一条指令是不够的。常常需要一系列指令才能完成。所谓程序,其定义就是:为完成某一任务的一系列指令的集合。程序包含一系列的指令。为完成某一任务的一系列指令,按顺序排列起来就构成程序。
程序和程序控制
现在,我们举例来说明程序和程序控制。第一个例子,戏剧歌舞晚会的演出。前面所说的戏剧歌舞晚会的节目表,就包含了要上演的每一个节目的指令。这一系列指令的编排,就是为了完成晚会上演节目这个任务的,所以根据我们关于程序的定义,这个包含了一系列指令的节目表,就构成了一个程序。整个晚会的节目演出过程,就可以说是一个程序控制过程。
作为程序控制的第二个例子,弹钢琴。钢琴有88个琴键。怎么弹?弹钢琴必须要有乐谱。乐谱上的音符告诉我们要弹哪些琴键。每一个音符就构成一个指令。乐谱上有一系列的音符,也就成为一系列的指令。根据我们关于程序的定义,乐谱就构成了弹钢琴的程序。弹钢琴的过程就是根据某个乐谱的既定程序出现的程序控制过程。基因的选择性表达也类似于弹钢琴。一个琴键就好比是一个基因。钢琴的88个琴键在任何时候都不会是同时弹奏的。88个琴键同时弹下去就不成其为音乐。要弹哪些琴键,不弹哪些琴键,任何时候都是有所选择的。琴声的表达就是一种选择性的、顺序性的表达。
基因表达程序
演戏是一个程序控制过程,弹钢琴是一个程序控制过程,那么基因的选择性表达是不是程序控制过程呢?基因是选择性表达的。要选择就得有个启动信号,或者说一个指令。要选择若干个基因来表达,就得有若干个指令。细胞的任何生理活动都涉及到一系列基因的表达。因此,就得有一系列的指令,方能实现。根据我们关于程序的定义,这一系列指令的集合,就构成一个程序。
用程序的观念来命名,演戏的节目表可以称为:戏剧演出程序。用于弹钢琴的乐谱可以称为:钢琴弹奏程序。那么,用来选择基因出来表达的这一系列指令所构成的程序,就可以命名为:基因表达程序。
基因表达程序的观察
怎样才能观察到基因表达程序?现在我们对于在细胞内控制基因选择性表达的指令信号,了解得还不清楚。因而对于控制基因表达的指令序列也看不明白。但是它所控制的效果,即基因选择性的、顺序性的活动形式被观察到了。犹如前面所说的戏剧歌舞晚会,在台下可以记录得到一个节目表。这个节目表与藏在幕后的节目表相比较,从所记载的信息来说是一模一样的。也就是说我们通过间接的方式也可以观察到舞台演出的控制程序(幕后的节目表)。我们对于选择性的基因表达的观察,也与之类似。控制基因表达的指令序列我们看不清楚,但是基因选择性表达的顺序活动形式可以被观察到,也可以把基因活动的“节目表”记录下来。这基因活动的节目表,与藏在基因调控系统内部书面写好的(例如DNA序列上写好的)节目表相比较,从所记载的信息来说,是一样的。内部的节目表是基因表达程序。外部观察到的节目表就是内部控制程序的外部显现。是内部控制程序的直接反映。也就是说,我们通过间接的形式也可以观察到基因表达程序的存在。
弹钢琴的例子也与之类似。前面已经讨论,弹钢琴可以看作是一个程序控制过程。其控制程序就是钢琴曲谱。但是在一个音乐会上听弹钢琴,那钢琴演奏家所使用的钢琴曲谱上有些什么音符,我们在台下却看不到。也就是说看不清楚钢琴弹奏的控制程序。钢琴演奏家具体弹了哪些琴键,在台下也看不清楚。但是他所演奏的乐曲是大家都听到了。一个受到过音乐训练的人还可以把听到的乐曲记录下来。这记录下来的乐曲,就是直接观察并记录到的钢琴弹奏的控制程序的信息。也就是间接地观察到了的钢琴弹奏的控制程序(钢琴家所使用的那个钢琴曲谱)。我们从果蝇多线染色体的8幅照片上,我们发现了什么?初步看,是发现了基因表达节目表。进一步看,从“戏剧演出”和“钢琴弹奏”这两个例子的分析来看,其实,我们所看到的基因表达节目表,就是果蝇细胞内控制程序信息在外部的反映,节目表就是直接显现出来的其内部控制程序的信息。总之,进一步看,我们发现了果蝇基因表达程序的指令序列信息,间接地看到了在果蝇细胞内部书面写好的基因表达程序。这就是本文所说的发现。
总之,一个程序控制过程,其内在的控制程序有可能通过其外部的表现来间接地观察到。
本来对于某个特定的细胞,在细胞分化过程中,有哪些基因表达了,以及表达的顺序如何,应该有逐个的记录。要有这样完整的记录,才算是完整地记录到了基因活动的“节目表”。我们目前的观察还是不完整的,所观察的还只是基因活动节目表的一个片断。尽管我们对于果蝇多线染色体的观察还不完整,但是这个基因活动的“节目表”有没有?这一点是肯定了。至少它是被我们观察到了一个片断。正是这种观察才让我们发现了基因表达程序的存在。
当然,我们的发现是有限的。犹如听弹钢琴,音乐,我们是听到了(是发现),可是弹钢琴的手指动作(指令)是什么样没看清楚,钢琴曲谱(程序)是什么样也没有看见。只是听到了音乐。只是从听到的音乐来确认指令和程序的存在。
为了看清楚本文所说的发现是什么,它的性质和作用,须得把它放在一个合适的知识体系之中,须得构建模型。犹如“苹果落地”这一司空见惯的自然现象的重新发现,倘若不把它放在力学的知识体系之中,便无法认识到这种发现的性质和作用。在基因调控领域,由于我们看出了:基因表达的调控是一个程序控制过程,故构建出了一个“基因表达的程序控制模型”。在这里,我们之所以说,所看到的“基因表达节目表”所反映的是控制指令的信息,所反映的是控制程序的信息,就是把所看到的节目表放在“程序控制模型”中来认识的。以下的论述是进一步探讨所发现的这一类遗传信息的性质和作用。这些论述称为:“基因表达的程序控制论”。简称为:“基因程控论”。以下的论述也是进一步阐述基因表达的程序控制模型。
基因表达程序是一种信息
程序是指令的集合。一条指令就是一个明确的信息。由若干条指令构成的程序,就代表了一个指令序列。程序就是这些指令信息的集合。犹如演戏的节目表,节目表就载有明确的信息。弹钢琴所用的钢琴曲谱,钢琴曲也载有明确的信息。基因表达程序也具有明确的信息。这些信息就是在一个基因表达程序中,有哪些基因表达的指令,以及这些指令的前后顺序。
必然显现出来的节目表
在基因表达过程中,显现出哪些信息出来?为蛋白质编码的结构基因的编码信息是显现出来了。与此同时,哪些基因表达了,以及表达的顺序,就是基因表达的“节目表”也显现出来了。这是基因表达过程中所显现出来的另一类信息。凡是有基因表达,都有基因表达节目表显现出来。基因活动“节目表”的客观存在,反映出了基因表达程序的客观存在。
基因表达程序可遗传
从基因表达的结果来看,无论是细胞分化、细胞分裂,还是细胞凋亡,同一物种的同一类细胞,其演变过程世代都具有相同的模式。这一事实支持了这样一种观点:那就是在细胞分化、细胞分裂、细胞凋亡这些过程中,其基因表达的控制程序是遗传的,其选择性的基因表达才会出现世代相同的模式。基因表达的控制程序是一种遗传信息。基因表达程序是一种遗传程序。
以细胞分化而论,任何细胞分化,都是沿着某一特定方向出现一系列严格有序的发育事件。最后形成一个形态功能特异的成熟的分化细胞。同一物种的同一种细胞,在细胞分化过程中,所出现的一系列严格有序的发育事件,所遵循的模式都是相同的,而且若干世代都相同。生物系统都是根据遗传信息建造起来的。同一物种的同一种细胞,在其分化过程中,只有当它们世代所表达的基因组合相同,而且表达的顺序也相同,也就是说,只有细胞世代的基因表达程序相同,才可能出现世代相同的分化模式。譬如弹钢琴,如果历次弹奏出来的音乐都相同,那么历次使用的钢琴曲谱就一定相同。也就是历次钢琴弹奏的控制程序相同。一首熟悉的钢琴曲,在演奏中,只要稍作改动,我们的耳朵就会发现。总之,必须要控制程序相同,才可能出现相同的演变模式。所以,我们说,基因表达程序是可以遗传的,是一种遗传程序。
遗传程序存储在细胞核DNA
基因表达程序的信息既然可以遗传,在细胞之中就必有其载体。而且这种载体,在细胞分裂过程中还要能够准确地复制,以传递给它的子代细胞。其子代细胞在需要这些信息的时候,读取这些信息,才能重现基因表达程序的信息。那么,基因表达程序的信息载体是什么呢?符合这些条件的就只有细胞核DNA。
受到程序控制的基因表达
选择性的基因表达,哪些基因能够表达,哪些基因不能够表达,以及表达的先后顺序,都不是随机发生的事件,而是受到控制的。一个基因,如果程序中有其表达的指令,它就表达。否则,就一直静息,不表达。其表达的先后顺序,也受到程序中的指令控制。为什么有些基因可以被激活?为什么有些基因可以被抑制?完全是由程序决定的。基因表达程序是早就编排好了的。犹如演戏,节目表是事先就编排好的。舞台上的演出只不过是根据节目表的安排而展开的一系列事件。无论是细胞分化、细胞分裂,还是细胞凋亡,其基因表达都是受到程序控制的,都是一种程序控制过程。其演变过程就是执行程序的过程。执行程序实际上就是按照给定次序执行一组指令的过程。只要启动不同的程序,细胞就可以执行不同的任务。
几种具体的基因表达程序
(1) 细胞分化表型的基因表达程序
这个程序是细胞走向分化表型的基因表达程序。实验表明,一切分化细胞,除了极少数例外,都保留着生物体生长发育的全部遗传信息。细胞分化为不同类型的细胞,是由于执行了不同的程序,基因表达有着不同的选择模式,才出现不同的表型。细胞的基因型都相同,只不过是它的表型不同而已。因此这个程序可以命名为:细胞分化表型的基因表达程序。简称为:细胞分化表型程序。
(2) 细胞分裂的基因表达程序
细胞分裂涉及到一系列的基因表达。细胞分裂从各种物质的合成开始,到分裂成为两个新细胞,经历了一系列的严格有序的事件。推测也是有一个基因表达程序,来控制严格有序的基因表达,才完成了这个复杂而有序的细胞分裂。细胞周期就是由这个基因表达程序控制的。这个基因表达程序可以命名为:细胞分裂的基因表达程序。简称为:细胞分裂程序。
(3 )发育的基因表达程序
生物个体的发育,从合子开始,经历了一系列严格有序的发育事件,按照相同的时间和空间顺序,构建世代相同的结构和模式。生物系统都是按照遗传信息建造起来的,发育过程也必然是基因选择性表达的结果,必定有一个基因表达程序,来控制发育过程中井然有序的基因表达。这个基因表达程序可以命名为:发育的基因表达程序。简称为:发育程序。
(4 )细胞凋亡的基因表达程序
细胞凋亡是一个自然的生理学过程,是一个主动的由基因表达程序决定的自动结束生命的过程。表现为严格的程序性调控,所以也常常被称为细胞编程性死亡。细胞凋亡是一个与任何其他生理学过程不相同的特殊过程,因为这种演变直接导致细胞自动结束其生命。必有其特殊的基因选择性的表达方式。在这个过程中也必然有一个基因表达程序,来控制其基因的选择性表达。这个基因表达程序可以命名为:细胞凋亡的基因表达程序。简称为:细胞凋亡程序。
所谓细胞编程性死亡,这个称谓很好,既形象,又指出了实质:这种细胞死亡,乃是按照编定的程序走向死亡。这个编定的程序就是细胞凋亡程序。当机体的生长发育或新陈代谢的某些阶段,如果认为某些细胞的存在是多余的,或者是不必要的,这些细胞将启动其细胞凋亡程序,就出现了这种编程性死亡。细胞凋亡程序是遗传信息存储器(细胞核DNA)中所固有的,是早已编排好的,只不过是到需要之时启动它而已。
细胞分化、细胞分裂和细胞凋亡,都是细胞执行一个程序的过程。细胞启动不同的程序,就可以执行不同的任务。生物的个体发育,则是全体细胞共同执行发育程序的结果。
程序控制的细胞分化
在细胞分化过程中,选择性的基因表达是由分化表型程序安排的。细胞分化是执行分化表型程序的结果。由于多细胞有机体的细胞具有社会性和相互间的依赖、从属和制约关系,分化前途尚未决定的细胞,在走向分化的过程中,其分化表型程序的编排,是在依赖和周围的细胞通信的基础之上,由每一个细胞自行决定编排的。编排出来的分化表型程序记录在细胞核DNA大分子上。在细胞分化时,就调用这个程序,以指令其选择性的基因表达。这种分化表型程序的编排,就是细胞分化前途的决定。所谓分化前途已经决定的细胞,就是其分化表型程序已经编排确定的细胞。
细胞分化是事先计划好的。这个计划就在于,细胞分化表型程序的一系列指令确定了要选择性地表达哪些基因,并确定了这些基因的表达顺序。细胞分化则是连续执行这些指令的结果。所以,已决定分化前途的细胞,即使脱离它原来的环境,也可以按照它原来的模式,自发的、有顺序的、按部就班地依次出现各种分化特点【4】。细胞分化表现为一个预先程序化了的自动控制过程。要是没有这个事先的计划,没有这个“细胞分化表型的基因表达程序”,要建造一个高度秩序化的、组织十分严密的、功能特异、智能化的细胞“机器”,则是不可想像的。由于有了这个程序,循序渐进的、有条不紊的细胞分化才得以实现。
不同分化类型的细胞具有不同的分化表型程序。由于分化表型程序不同,其指令序列就不同,基因表达就有着不同的组合方式,有着不同的表达顺序。基因表达的结果就分化成为不同类型的细胞。事实上,在每种类型的细胞中特异表达基因的顺序也是不同的【5】。W.Beerman等发现,虽然在有机体不同类型分化细胞的相同染色体上,所见到的带型是一致的,但不同类型细胞染色体上的各条横带表现出不同的特征。不同的细胞类型有不同的特定横带膨胀成为胀泡【6】。这种基因活动的可见证据也表明,不同类型的细胞其选择性的基因表达是不同的。
由于细胞分化表型程序记录在细胞核DNA大分子上,在细胞分裂时,就可以准确地复制而遗传给它的子代细胞。子代细胞分化时,执行遗传得到的分化表型程序的结果,就分化成为同类型的细胞。细胞的分化型式和状态就得以遗传传递。
基因选择性表达的必然性
细胞包含了生物个体生长发育以及各种生命活动的全部遗传信息。细胞执行任何生理功能都不可能同时读取其全部遗传信息。要全部读取,第一.办不到;第二.也没有必要。实际的观察也是这样,细胞中的基因常常数以万计,而在每个具体的细胞中,表达的仅占少数。任何时候的基因表达,都只能是选择性的。
基因表达程序存在的必然性
基因活动的“节目表”是基因表达过程中,显现出来的另一类遗传信息。这一类遗传信息并不存在于为蛋白质编码的结构基因之中。同一物种的发育过程,在时间和空间的顺序上世代都遵循相同的模式,这提示物种所具有的发育程序是世代相传的。同一物种的同一种细胞,它们的细胞分裂、细胞分化、细胞凋亡,在其演变过程中所展现的一系列事件,也都世代遵循相同的模式,这提示细胞分裂程序、细胞分化表型程序、细胞凋亡程序等这些程序都是世代相传的。这些基因表达程序的信息必定存储在遗传物质之中,存储在细胞核脱氧核糖核酸的大分子之内。在真核细胞基因组中,除了为蛋白质编码的结构基因而外,还有大量的“额外”DNA序列的功能还没有被发现,在这些“额外”DNA序列之中,必定存储着各种基因表达程序。
演奏生命的乐章
现在,经过人类基因组计划的测序,发现我们人类基因的数目并不多。其他许多物种的基因数量也有限。然而生命现象又为什么那么多姿多彩呢?其实,钢琴的琴键数目才只有88个,为什么可以演奏出那么变化万端、美妙绝伦的音乐来呢?琴声之妙,并不仅仅在于88个琴键中的每一个琴键的声音好听。基因表达也是一样,是以有限数目的基因作为“琴键”,以基因表达程序作为乐谱,演奏出生命的乐章。
钢琴演奏之所以好听,第一,钢琴要制作得好,每一个琴键弹下去,声音都要好听;第二,还要作曲家的乐曲美妙。也就是说,还要有钢琴弹奏程序美妙。美妙的钢琴曲,蕴藏了作曲家许多高深的艺术和人文的思维。美妙的钢琴曲,记录了非常高深和感人的音乐信息。由此,我们可以看到,在生物的遗传信息中,除了为蛋白质编码的结构基因以外,还有更深层次的遗传信息,那就是基因表达程序。基因表达程序是演奏生命的乐章。生命现象之所以那么多姿多彩、精彩绝伦,甚至常常令人惊叹不已,原来基因表达程序就是那优美的钢琴曲!大自然的演化造就的生物的遗传程序,蕴藏了无限高深的“音乐信息”,蕴藏了美妙绝伦的乐章。
比基因层次更高的遗传信息
基因是重要的。但是基因表达程序可以决定哪些基因表达,哪些基因不表达,可以决定基因表达过程中基因的组合与排列!所以,基因表达程序是比基因层次更高的遗传信息。细胞增殖、细胞分化和细胞凋亡,是细胞重大的生命活动。怎样才能够对这些生命活动施加影响?是许多人感兴趣的课题。从哪里入手?看来,基因表达程序可能处于更为重要的地位。
生物的复杂性与遗传程序
生物的复杂性反映了生物进化的程度。人类是万物之灵。我们人类的遗传信息是否能够反映出这种复杂性呢?人类基因组计划是在于对基因的高度期望中进行的。人类基因的数目原先估计为10万个。但是,根据人类基因组计划的测序,发现人类基因数目比预期的要少。测序初步完成之时认为,大概为3万~3.5万个。到现在则认为只有2万个左右。基因数目大大低于预期数。这个事实让许多人感到失落。作为万物之灵的人类,为什么在基因数量上竟至于与果蝇甚至线虫相比,并没有什么明显的优势呢?其实,有一个已知的事实,那就是:随着生物的进化,非编码序列在基因组中所占的比例越来越大。这就意味著随着生物的进化,在基因组中基因表达程序存在的空间越来越大。有可能就是,生物越是高等,其基因表达程序的信息量越大。生物的复杂性不仅仅取决于基因数量的多少,还要看基因表达程序信息量的多少。基因表达程序是演奏生命的乐章。每多一个程序,基因表达就多一种基因的组合与排列的方式。基因表达程序信息量越大,生物所能显示的结构和功能的特色越多。基因表达程序是生物的遗传程序。作为万物之灵的人类与其他哺乳动物在遗传信息上的区别,恐怕更为重要的还是遗传程序的差别。例如,人和黑猩猩的非编码DNA中,有些序列就已经存在很大程度的趋异。遗传程序决定了人类具有更高的复杂性。如果遗传程序是演奏生命的乐章,那么,人类的遗传程序就能够演奏出更为高深、更为动听的乐章。
癌变:基因表达程序出错论
细胞的癌变,可能是其分化表型程序出现了错误。细胞在分化过程中执行了错误的程序,才出现一系列的形态结构、生化特性和生理机能的错误。分化表型程序的错误,是一种DNA序列错误,可以与其发源组织的正常细胞的分化表型程序作出对比,这种DNA序列的错误在对比中可以认别出来。这种DNA序列错误就是细胞癌变在分子水平上的关键性改变。
分化表型程序的错误的多少,决定了肿瘤细胞的性质。错误多,为恶性;错误少,为良性。错误越多,恶性程度越高。错误由少到多,细胞依次表现为从良性到恶性的一系列从量变到质变的过渡形式。
程序、指令的形式
程序、指令的可能形式如下。
遗传程序存储在基因组DNA序列之中。它的转录物就是指令。每一条指令包括地址指令和操作指令。为什么会有地址指令?因为基因数量成千上万,怎样才能找到一个确定要表达的基因?是大海捞针吗?基因没有地址编号是无法找寻的。与基因相间排列的中等重复序列可能就是基因的地址编号。(1)每一个基因都有一个独立的地址编号。其编号依其所在的位置顺序而呈现一定的顺序性;(2)等位基因的地址编号相同;(3)染色质是DNA折叠打包的包装物,染色质外部有包装标记RNA,是其内部基因的地址编号。
地址指令是一种小分子RNA,由基因表达程序的DNA序列转录产生。地址指令RNA通过与基因的地址编号序列实现碱基互补配对,而确认找到并启动该编号的基因。
操作指令。在选择性基因表达的三个层次上都有若干蛋白质因子参与操作:(1)染色质的松开活化;(2)基因的选择性转录;(3)hnRNA的选择性剪接。在这三个层次上参与操作的蛋白质因子都可以视为操作指令。
然而在哪里操作,却离不开地址指令对操作位置的准确指定。
细胞分化表型程序的实验找寻
同一生物个体的不同分化类型的细胞,其基因组DNA序列绝大部分都相同,但是,其分化表型程序所在的DNA序列不相同。因此,可以用两种不同类型的分化细胞,进行DNA序列对比。不相同的DNA段落,便是细胞分化表型程序。
细胞癌变的关键性改变的实验找寻
癌细胞与其发源组织的正常细胞相比较,其基因组DNA序列绝大部分都相同,只有分化表型程序存在错误。因此,可以进行DNA序列对比。这种序列错误可以在对比中认别出来。这样对比认别出来的DNA序列上的错误,就是细胞癌变在分子水平上的关键性改变。
此外,还可以证实这种DNA的序列错误,是不是发生在前述实验所找到的分化表型程序的DNA段落之中。
为了证实肿瘤细胞的恶性程度,与其分化表型程序的错误多少是否存在相关性,可以分别用恶性程度不同的肿瘤细胞、异质性程度不等的良性肿瘤细胞,乃至交界瘤,逐个地与其发源组织的正常细胞进行DNA序列对比。看是否是DNA序列错误的增多与恶性程度的增加呈现相关性。错误由少到多,细胞依次表现从良性到恶性的一系列从量变到质变的过渡形式。而且错误越多,恶性程度越高。
讨论
(1) 问:昆虫多线染色体在基因表达过程中,其胀泡出现有次序的变化,早就有人多次观察到了。这能够叫做发现吗?
答:石头从山上滚落下来,千百年来,已经被千百万人看到过了。可是没有人发现重力加速度。重力加速度直到近代才被科学家发现。所以,从熟视无睹的现象中,找出新的科学事实,也是一种发现。
昆虫多线染色体在细胞分化过程中,基因活动顺序性的发现,是基因表达受到调控的一个明确可见的证据。其意义十分重大。本文只是在此基础上前进了一小步。
(2) 问:本文所依据的观察记录,是别人的观察记录。这能够叫做发现吗?
答:从别人的观察记录中发现,也是发现。例如,DNA双螺旋模型的建立,所依据的观察记录:DNA晶体的X光衍射照片,就是别人的观察记录。根据这个衍射照片,经过艰苦探索,才构建出DNA双螺旋模型。
构建出这个模型,也是发别人之所未发。
(3)问:多线染色体的胀泡变化,这么简单,也算一种发现?
答:发现并不分简单复杂。再简单的事物,只要是人类尚不知道的,或者尚未认知的,你能够明确地指认出来,那就是一种发现。
参考文献
1.沈羽非方福德主编:真核基因表达调控,第2版 高等教育出版社 1992.12. 第111—112页。
2.翟中和王喜忠丁明孝主编:细胞生物学,高等教育出版社 2000. 第280页。
3.John W. Kimball:细胞生物学,陈立滇等译 科学出版社 1983.第235—237页。
4,上海细胞生物学研究所:细胞世界探索,上海科学技术出版社,
1983,175~181。
5,郑国锠:细胞生物学,北京:人民教育出版社,1980,413。
6,A.C.Braun. 汪堃仁等译,癌—本质、病因和控制,北京:人民卫生出版社,1981,19。
谭祖佑 邮箱:zuyoutan@sina.com 此文为"基因程序控制论"系列论文之一