第四章 冬日饥荒
同卵双胞胎拥有完全相同的遗传密码。他们不仅共同孕育于同一个子宫,而且通常来说生长环境也极为相似。考虑到这些因素后,我们就不会对双胞胎之间的一致性感到诧异,如果其中某个双胞胎患有精神分裂症,那么另一个双胞胎罹患该病的概率应该很高。事实上,我们应该思索为什么这个数字不能更高?例如说概率为什么不是100%?1
——内莎·凯里(Nessa Carey),
《表观遗传学革命》(The Epigenetics Revolution)
基因概念在20世纪得到了迅猛发展,并且将我们引领到生物学新时代的边界,而这也为人类社会进步提供了坚定的承诺。与此同时,在其他生物学体系概念、观点与思想的推动下,基因势必摆脱原有的束缚,在生命科学的天空里自由翱翔。2
——伊夫林·福克斯·凯勒,
《生物医学中的人类学》(An Anthropology of Biomedicine)
在前述章节中隐藏着一个亟待解决的问题:如果“自我”只是事件与基因之间交互作用产生的偶然现象,那么我们又该如何证明这个过程呢?例如,双胞胎中的一个在冰面摔倒导致膝盖骨折,然后受伤部位形成骨痂,而另一个双胞胎却安然无恙。再如,某位孪生姐妹嫁入了德里的名门望族,而另一个却只能委身于加尔各答的没落人家。那么细胞或机体是通过何种机制来记录这些“命运”的呢?
其实在过去的几十年间,人们公认基因就是解决上述问题的标准答案。更确切地来讲,答案在于如何调控基因的启动或者关闭。20世纪50年代,莫诺与雅各布在巴黎已经证实,当细菌所需的养分从葡萄糖转换为乳糖时,它们将关闭葡萄糖代谢基因并启动乳糖代谢基因。将近30年以后,两位研究蠕虫的生物学家发现,邻近细胞发出的信号可以决定某个细胞的命运,它们将通过启动或者关闭主控基因导致细胞谱系发生改变。当某个双胞胎在冰面摔倒后,其体内促进伤口愈合的基因就会启动,并且让骨折断端硬化形成骨痂。甚至就连大脑在储存复杂记忆的时候也伴随着基因的启动与关闭。当夜莺遇到其他同类发出与众不同的鸣叫后,其大脑中的ZENK基因表达水平就会升高。可是如果这种叫声来自不同的物种或者表现为降调,那么ZENK基因的表达水平将大打折扣,而夜莺也不会对于这种声音留下记忆。3
但是对于细胞与机体(针对环境输入做出应答:跌倒、意外与创伤)中的基因活化与抑制作用来说,它们能给基因组留下某种永久性的标志或印记吗?当生物体进行复制的时候,这些标志或印记可以传递给其他生物体吗?来自环境的信息能否跨代进行传递呢?
※※※
我们现在即将进入基因发展史上最具争议的领域,理清某些重要的历史脉络是当务之急。20世纪50年代,英国胚胎学家康拉德·沃丁顿(Conrad Waddington)就曾经尝试着去理解环境信号对于细胞基因组的影响。4他在胚胎发育过程中注意到,成千上万种不同类型的细胞(神经元、肌细胞、血细胞以及精细胞)均源自同一个受精卵。沃丁顿为此做了一个非常形象的比喻:胚胎分化的过程就像无数颗弹珠从沟壑纵横的斜坡上滚落。他认为每个发育中的细胞在“沃丁顿景观”中都有自身独特的路径,但是由于它们在途中被困在某些特殊的沟坎或缝隙中,因此限制了细胞分化的类型。
在沃丁顿看来,细胞周围环境对于基因的影响方式令他十分好奇。他将这种现象称为“表观遗传”,其字面含义就是“基因之外”[1]。沃丁顿写道,表观遗传学关注的是“基因与其周围环境交互作用后产生的表型”。
如果仅凭基因的瞬间启动与关闭就可决定机体的命运,那么这个过程为何无法逆转呢?尽管上述问题看似无足轻重,但却是长期困扰生物学家的难题:如果不存在“锁定”命运的正向机制,那么也就无从谈起什么反向机制。如果基因开关的作用时间转瞬即逝,那么为何命运或记忆却无法做到昙花一现呢?为什么我们不能返老还童呢?
※※※
此时沃丁顿从一项可怕的人体实验中找到了理论依据,万幸其结果并没有对受试人群的后代产生显著影响。1944年9月,第二次世界大战进入最为残酷的阶段,占领荷兰的德国军队禁止将粮食与煤炭运往该国的北部地区,并且全面封锁了水陆交通。鹿特丹港的起重机、船只以及码头全部被炸毁,整个情景就像某位电台播音员描述的那样,只留下了一个“在死亡边缘痛苦挣扎的荷兰”。
由于荷兰的内陆河网四通八达,因此封锁无疑让这个处于战火中的国家雪上加霜,而阿姆斯特丹、鹿特丹、乌得勒支与莱顿等城市的食品与燃料供应完全依赖外界定期运输。到了1944年初冬,送抵瓦尔河与莱茵河北部省份的战时配给严重供不应求,当地百姓面临着饥荒的威胁。虽然同年12月水路重新开放,但是航道已经完全冻结。首先是黄油从餐桌上消失,接下来是奶酪、肉、面包与蔬菜。在绝望、寒冷与饥饿的驱使下,人们先是用自家院子里种植的郁金香球茎与菜皮充饥,然后又被迫开始食用桦树皮、树叶与野草。最终,食物摄入量降至每天约400卡路里,只相当于3个土豆所能提供的热量。有人曾经写道,人们“只剩下饥饿与本能”5。时至今日,这段历史依然铭刻在荷兰人民的记忆中,并且被正式称为“冬日饥荒”(Hunger Winter)或“饥饿冬天(Honger winter)”。
这场饥荒一直持续到1945年。虽然死于营养不良的男女老幼数以万计,但是最终还是有几百万人得以幸免。在这种营养条件剧烈变化的过程中,实际上催生出某种可怕的自然实验:当人们摆脱了冬日饥荒的煎熬后,研究人员开始审视突如其来的灾难对特定人群的影响,而他们曾经预测人们会出现诸如营养不良与生长迟缓之类的表现。此外,饥荒中幸存的儿童也面临着慢性健康问题:抑郁、焦虑、心脏病、牙龈病、骨质疏松症与糖尿病等。(著名女演员奥黛丽·赫本也是幸存者之一,她曾经饱受各种慢性病的折磨。)
然而到了20世纪80年代,研究人员却发现了一种非常有趣的模式:对于那些在冬日饥荒期间怀孕的女性来说,她们的孩子在长大成人后具有较高的肥胖症与心脏病发病率。6当然这一发现也在预料之内。由于子宫内的胎儿在营养不良的条件下会出现生理机能变化,因此在营养物质缺乏的情况下,胎儿的代谢方式将改为通过储存大量脂肪来抵御热量损失,从而导致迟发性肥胖与代谢紊乱。但是如果想要从冬日饥荒中获得具有说服力的结果,那么我们还需要把其后代的数据纳入综合考虑。20世纪90年代,研究人员发现冬日饥荒幸存者的孙辈也存在较高的肥胖症与心脏病发病率。不知什么原因,突如其来的饥荒不仅对于经历浩劫的幸存者基因产生了影响,而且这些遗传信息还传递到了他们的孙辈。因此某些遗传因素或因子必定已经在饥饿人群的基因组中留下烙印,并且其作用还至少延续了两代人。冬日饥荒不仅载入了史册,同时也形成了这个民族的遗传记忆。[2]
※※※
但什么是“遗传记忆”呢?遗传记忆是如何超越基因本身进行编码的呢?沃丁顿并未接触过关于冬日饥荒的研究,尽管大部分结果直到他于1975年去世时都未引起重视,但是遗传学家还是机敏地发现了沃丁顿假说与上述多代疾病之间的联系。其中的“遗传记忆”现象显而易见:饥荒幸存者的子孙容易发生代谢性疾病,仿佛他们的基因组携带有祖辈代谢异常的记忆。但是基因序列的改变不可能是产生此类“记忆”的原因:这项队列研究涵盖的人数成千上万,他们的基因不会在祖孙三代人中均发生同样的突变。对于冬日饥荒的幸存者来说,“基因与环境”之间的交互作用改变了他们的表型(例如,发展成某种疾病的倾向)。当人们遭遇饥荒的折磨后,必定会有某种成分融入了基因组,而这些永久性的遗传标记可以世代相传。
假如上述信息能够插入基因组,那么它将带来前所未有的改变。首先,它将挑战经典达尔文进化论的本质特征。从理论上来讲,达尔文进化论的一个重要观点就是,基因无法以某种永久性的可遗传方式来记住生物体的经历。即便羚羊使劲伸长脖子想去够到高处的树叶,其基因也不会为这种努力留下印记,而它的后代更不可能变成长颈鹿(请不要忘记,拉马克进化论的谬误之处就是把适应性直接作为遗传性状)。更确切地来说,长颈鹿的出现是自发变异与自然选择的结果:它们的祖先中可能会出现某些颈部较长的突变体,而在饥荒肆虐期间,这些具有长颈的个体经过自然选择后得以生存。奥古斯特·魏斯曼曾经切断五代小鼠的尾巴来验证环境因素是否能够永久性地改变它们的基因,可是他没有想到第六代小鼠依然长出了完整的尾巴。进化可以在不经意之间造就完美适应环境的生物体:理查德·道金斯认为进化是个丢三落四的“盲眼钟表匠”。生存与选择是进化的唯一驱动力,突变则是它仅存的记忆。
对于冬日饥荒幸存者的孙辈来说,他们获得祖辈饥荒记忆的机制与突变和选择无关,而是把环境信息转化成为某种可以遗传的因子。我们可以将此类“记忆”遗传的形式视为进化过程中的“虫洞”。例如长颈鹿的祖先并没有经过马尔萨斯逻辑、生存与选择的考验,这些个体可能只是把伸长脖子的记忆永远铭刻在其基因组中。依此类推,切断尾巴的小鼠在把信息反馈给基因后应该生出短尾的后代。此外,在启发性环境下成长的孩子的子孙也应具有积极向上的心态。其实上述想法不过是达尔文泛生论的复述,无非是想说明生物体特殊的经历或者历史可以直接影响基因组。这种系统就像是生物体适应性与进化之间的快速公交,它可以让盲眼钟表匠重见光明。
然而沃丁顿本人在该问题的答案上有着自己独到的见解。沃丁顿从年轻时就信仰马克思主义,他认为发现基因组中的“记忆定格”元素不仅可以完善人类胚胎学研究,还将帮助其实现宏伟的政治抱负。如果可以通纵操纵基因记忆来左右细胞的功能,那么也许人类也可以被思想改造(回想一下李森科曾对小麦植株的尝试,还有斯大林试图消灭不同政见者的举动)。这种过程可能会抹去细胞的固有身份,并且允许其沿着“沃丁顿景观”反向运动,于是成体细胞开始向胚胎细胞转化,原有的生物钟也发生了逆转。它甚至有可能解开关于人类记忆、身份与选择的固定不变之谜。
※※※
直到20世纪50年代末期,表观遗传学还处于远离现实的想象阶段:当时没有人能够从基因组水平诠释细胞的历史或身份。1961年,在相距不足20英里的地方,研究人员在6个月之内分别进行了两项不同的实验,其结果将改变人们对于基因的理解,并且为沃丁顿的理论提供强有力的支持。
1958年夏季,约翰·格登(John Gurdon)在牛津大学读研期间开始专注于青蛙的生长发育。格登在人们的印象中并不是个有前途的学生,他的生物学成绩曾经在全年级250人中排名倒数第一。但是就像格登自己描述的那样,他“做事十分专注”7。而格登此后也在研究中把自身的优势发挥到了极致。20世纪50年代早期,两位在费城工作的科学家通过吸出细胞核的方法将未受精青蛙卵细胞中的全部基因去除,然后再将其他青蛙的基因组注入剩下的无核卵细胞内。这就像是把假鸟偷偷放入鸟巢,然后期待它可以在那里正常发育。那么“鸟巢”(也就是去除全部自身基因的无核卵细胞)是否含有其他青蛙基因组发育成胚胎所需的所有因子呢?实验结果证明了上述结论,来自费城的研究人员将某只青蛙的基因组注入无核卵细胞后孵出了蝌蚪。我们可以把它视为某种极端的寄生方式:卵细胞不过是个宿主或容器,它为来自正常细胞的基因组提供了场所,并使其发育成完全正常的成年动物。研究人员将这种方法称为核移植,由于在实际应用中成功率极低,因此他们最终基本上放弃了该技术。
格登对上述研究非常着迷,于是他也开始在实验中尝试这种方法。值得注意的是,前面那两位费城同行注入去核卵细胞的是幼胚细胞核。1961年,格登将成年青蛙小肠细胞的基因组注入去核卵细胞,希望能够借此来验证该方法是否可以培养出蝌蚪。8在当时的实验条件下,格登面临着巨大的技术挑战。为了确保细胞质完好无损,格登首先通过极低剂量的紫外线照射来破坏未受精青蛙卵细胞的细胞核。然后就像跳水运动员纵身跃入泳池一样,他用极其锋利的细针垂直刺破卵膜,并且在膜表面几乎无损的前提下将包裹于液体中的成年青蛙细胞核注入。
这种将成年青蛙细胞核(即全部基因)移植到去核卵细胞的实验大获成功:格登培养出的蝌蚪具有全部正常功能,同时每只蝌蚪均携带有与成年青蛙基因组完全一致的拷贝。如果格登能够将某只青蛙的多个成体细胞核移植到多个去核卵细胞中,那么他不仅可以培养出完美的蝌蚪克隆,还能够实现原始供体青蛙的克隆。该过程可以循环往复地持续下去:这些克隆将会不断产生新的克隆,而所有的个体都将携带相同的基因型,也就是说此类复制过程通过无性繁殖即可完成。
格登的实验结果激发了许多生物学家的想象力,但是产生这种轰动与其科幻小说般的情节毫无关系。格登曾经在实验中使用青蛙的小肠细胞培育出18个克隆体,然后将它们分别置于18个完全相同的培养皿内,而这些克隆体就像是隐身于18个平行宇宙中的分身幽灵(Doppelgänger)。与此同时,格登实验所蕴含的科学原理也令人们浮想联翩:当完全成熟的成体细胞基因组与卵细胞的细胞质短暂接触后,它又可以恢复成为一个具有完全活力的胚胎。简而言之,卵细胞能够为基因组提供发育成为合格胚胎所需的全部因子。随后,人们在格登实验的基础上把研究对象扩展至其他动物。其中最著名的研究成果当属克隆羊多利,而这也是世界上首次通过无性生殖培育出高等生物9(生物学家约翰·梅纳德·史密斯后来评论:除此之外,只有耶稣基督诞生可以勉强与哺乳动物的无性生殖相提并论10)。2012年,格登凭借在核移植领域中的贡献荣获了诺贝尔奖。[3]
但是格登实验的光环并不能掩盖其存在的问题。虽然通过成年青蛙的小肠细胞可以培育出蝌蚪,但是实验的操作步骤耗时费力,而且核移植的成功率非常低。因此人们迫切需要某种超越传统遗传学的理论对此进行解释。成年青蛙基因组中的DNA序列与接受核移植的胚胎或培养出的蝌蚪完全一致。根据遗传学基本原则,上述细胞应该含有相同的基因组。可是如果这些基因分布于不同的细胞中,那么它们可能会在某些条件下被启动或关闭,从而控制胚胎发育为成熟个体。
但是如果这些基因从结构上没有任何区别,那么为何成体细胞的基因组无法将其诱导为胚胎呢?而且就像其他研究结果证实的那样,为什么年幼动物的细胞核要比年长动物的细胞核更容易让胚胎发育出现逆转呢?实际上,格登实验与冬日饥荒研究均再次验证了某些累积因素的强大力量,它们可以循序渐进地在成体细胞基因组中留下永久的标记,从而使基因组在发育过程中有进无退。虽然这些标记并不存在于基因序列之中,但是基因表达却发生了可遗传的改变。现在格登又回到了沃丁顿提出的问题上:如果每个细胞的基因组中都携带有反映其历史与身份的印记,那么它可以被视为某种形式的细胞记忆吗?
※※※
从抽象意义上来讲,这种表观遗传标记似乎已经清晰可见,可是格登却没有在青蛙基因组上观察到此类印记。1961年,沃丁顿曾经的学生玛丽·莱昂(Mary Lyon)在某个动物细胞中发现了表观遗传改变的有力证据。莱昂是家中的长女,父母分别做过公务员与教师。她曾经在剑桥读研期间师从脾气暴躁的著名学者罗纳德·费希尔,但是很快莱昂就转到爱丁堡大学继续完成了学位。当莱昂毕业之后,她来到英国小镇哈维尔的一所实验室工作,并且在这里组建了自己的研究小组,而此处距离牛津大学只有20英里。
莱昂在哈维尔主要从事染色体生物学方面的研究,她在实验中通过荧光染料来观察它们的形态变化。令人惊讶的是,莱昂在雌性小鼠细胞中发现,除了两条X染色体之外,每对着色的染色体看上去都大同小异,而且其中有一条X染色体必然会出现皱缩与浓聚。研究证实皱缩后的染色体基因并未发生改变:两条染色体上的DNA序列完全相同。然而它们的活性却大相径庭:皱缩染色体上的基因无法编码RNA,因此整条染色体处于“沉默”状态。仿佛该染色体在被强制退役的同时彻底失去活性。莱昂发现失活的X染色体呈随机分布,它们在不同的细胞中可能分别来自父本或者母本X染色体。11这种模式是所有包含两个X染色体的细胞的普遍特征,也就是说雌性动物的每个细胞均符合上述特征。那么X染色体失活有什么意义呢?由于雌性动物具有两条X染色体,而雄性动物只有一条X染色体,因此X染色体失活可以让具有两条染色体的雌性动物细胞产生相同“剂量”的基因。
时至今日,我们仍不清楚X染色体发生选择性沉默的原因或意义。但是X染色体的随机失活却可以产生重大的生物学意义:雌性动物是两种不同细胞组成的嵌合体。在大多数情况下,X染色体随机沉默无法通过表型来检测,除非某条X染色体(例如来自父本X染色体)上碰巧携带明确表征的变异基因。即便是这样,细胞表达变异基因的情况也会不尽相同,于是就产生了嵌合样效应。例如,在猫科动物中,控制毛色的基因位于X染色体。X染色体随机失活将导致细胞产生不同的色素,因此只有通过表观遗传学而不是遗传学才能解释三色猫毛色的难题。(如果人类肤色基因也位于X染色体上,那么不同肤色夫妻所生女孩的皮肤也将表现为深浅不一。)
那么细胞是如何使整条染色体发生“沉默”的呢?该过程涉及的内容非常复杂,已经超出环境信息导致个别基因活化与失活的范围,整条染色体以及上面的全部基因都将永久性失活。20世纪70年代,学术界提出了一项最符合逻辑的猜测,也就是细胞以某种方式为染色体中的DNA打上了永久的化学烙印,或者说是某种分子水平的“休止符”。既然基因本身的结构始终保持完整,那么此类标记应该附在基因之上,而这也符合沃丁顿提出的表观遗传理论。
20世纪70年代末期,正在研究基因沉默现象的科学家发现,附着在DNA上的一种名为甲基的小分子与基因关闭有关。而该过程的主要策动者之一后来被发现是一种名为XIST的RNA分子。研究发现上述RNA分子“覆盖”了染色体的部分区域是产生染色体沉默的关健因素。同时这些甲基标签好似项链上的饰物,它们被认为是某些基因的关闭信号。
※※※
然而甲基标签并非DNA链上唯一的修饰物。戴维·阿利斯(David Allis)是来自纽约洛克菲勒大学的一名生物化学家,他于1996年发现了另一种能够对基因产生永久影响的标记系统。[4]该系统可以作用于包装基因的组蛋白(histone),而不是直接在基因上留下标记。
组蛋白与DNA紧密结合在一起,它们盘绕成螺旋状结构并形成染色体骨架。当骨架发生变化时,基因的活性也将会随之发生改变,而这就像是通过改变包装规格来影响材料的属性(缠绕成团与拉伸成束的丝线属性截然不同)。于是附着在蛋白质上的环境信号就可以间接地在基因上留下“分子记忆”。当细胞开始分裂,这些分子印记将被复制到子细胞中,并且记录下几代细胞的足迹。可想而知,当精子或者卵子形成时,分子印记也会被复制到生殖细胞中,从而记录下几代生物体的变迁。虽然关于组蛋白标记的研究尚有待完善(其中就包括组蛋白标记的遗传性与稳定性,以及确保它们出现在合适的时间与地点的机制),但是对于酵母菌与蠕虫等简单生物体来说,它们体内的组蛋白标记似乎能够延续数代。12
※※※
我们现在已经知道,在各种化学标签与标记的作用下,基因沉默与活化是一种切实可行的基因调控方法。尽管人们在几十年前就发现了基因可以短暂启动与关闭,但是这种沉默与重新激活的系统不会转瞬即逝,并且会在基因上留下永久的化学印记。[5]它们将根据来自细胞或环境的信息做出添加、消除、放大、缩小、打开或关闭等应答。[6]
这些标记就像是语句中的注释或者书中留下的旁注(铅笔线、划线单词、划痕、划掉的字母、下标与尾注),它们可以在基因序列不变的前提下对基因组起到修饰作用。假设生物体中每个细胞的遗传信息均源自这部作品,可是它们采取的处理方式却各有千秋,例如划掉与添加特殊句型、“沉默”与“激活”特定单词以及强调某些短语,那么这些细胞将根据相同的脚本撰写出不同的故事。我们可以通过以下例句来反映人类基因组中化学印记的表现形式:
…This…is…the…… , , ,……struc…ture , ……of… Your……Gen…ome…
就像前述章节描写的那样,上述例句中的单词对应的就是基因。省略号与逗号代表了内含子、基因间区域与调控序列。而粗体大写字母与划线单词就相当于附加在基因组上的表观遗传标记。
现在人们终于找到了格登实验难以逆转成年青蛙小肠细胞胚胎发育的症结:由于小肠细胞基因组被附加了许多表观遗传“标签”,因此只有将这些“标签”抹除后才能让它转化为胚胎基因组。虽然我们能够改写基因组上的化学印记,但是这就像改变人类记忆一样困难重重,而上述化学印记保持稳定将确保细胞身份不会轻易发生改变。只有胚胎细胞基因组具备足够的灵活性时,这些细胞才可能获得与众不同的身份,并且进一步发育成为体内各种类型的细胞。一旦胚胎细胞的身份固定下来,例如分化为小肠细胞、血细胞或神经细胞,那么该过程就几乎没有逆转的可能(因此格登在青蛙小肠细胞逆向培育蝌蚪的实验中举步维艰)。胚胎细胞可以根据相同的脚本演绎出各式各样的作品,而其它细胞就像是一本已经定调的青年小说,很难将其改编成为维多利亚式的恋爱故事。
※※※
虽然表观遗传学部分诠释了细胞的个体特征之谜,但是也许它还可以破解更为复杂的人类个体差异之谜。我们曾经在之前的章节中问过:“为什么在相同环境与家庭中成长的同卵双胞胎会拥有迥异的生活与特征呢?”现在我们可以将其解释为双胞胎体内具有记录特殊事件的化学标记。然而这些化学标记又是以何种方式进行“记录”的呢?实际上基因序列中并不存在此类标记:如果你在50年内每隔10年对某对同卵双胞胎进行基因组测序,那么全部测序结果均会保持一致。但是如果你在同样的时间段内把测序对象改为表观基因组,那么就会发现他们的结果迥然不同:在实验伊始阶段,双胞胎体内附着于血细胞或神经元上的甲基基团几乎完全相同,但是它们之间的差异在第一个10年到来时就会逐步显现,并且将在50年后成为天壤之别。[7]
研究显示,双胞胎对于随机事件(创伤、感染与冲动)、乐曲旋律以及街头美味(巴黎的玛德琳蛋糕)的反应千差万别。而这些事件可以让他们体内的基因“启动”或者“关闭”,并且逐渐在基因序列中留下表观遗传标记。[8]尽管每个基因组都携带有创伤修复与机体愈合的信息,但是它们只是在被写入基因后才能够发挥作用,甚至可以说环境信号也需要借助基因组来显示其存在。如果说“后天”因素的影子无所不在,那么它也只是“先天”因素的映像。但是这种想法却让人们面临某种惴惴不安的哲学困境:如果抹去双胞胎基因组中的表观遗传印记,那么是否这些偶然事件、环境因素与后天因素从理论上就可以销声匿迹了呢?同卵双胞胎的命运能否真正实现表里如一?
豪尔赫·路易斯·博尔赫斯(Jorge Luis Borges)是享誉世界的阿根廷文学家,他曾经发表过著名短篇小说《博闻强识的富内斯》(Funes the Memorious),书中描写了一位遭遇意外的年轻人,他苏醒后发现自己拥有了“完美”的记忆力。13富内斯能够记住生活中的每个细节、每件物体以及每次相遇,其中甚至包括乌云的形状或者皮面精装书的纹理。可是这种非凡的能力并未让富内斯从瘫痪中恢复。富内斯被洪水般涌来的记忆淹没,它们就像喧闹人群中持续发出的噪声,而他自己却根本无力反抗。博尔赫斯笔下的富内斯在黑暗中蜷缩于行军床上,由于无法阻止外界信息的疯狂涌入,因此他只能被迫选择这种与世隔绝的生活。
假如细胞丧失了选择性沉默部分基因组的能力,那么就会造就这位博闻强识的富内斯(或者,就像该故事描述的那样,这种环境只能培养出孤陋寡闻的富内斯)。基因组中携带着构建各种生物体、组织以及细胞的信息,而缺乏选择性抑制与重新激活系统的细胞将会被海量信息流淹没。令人感到自相矛盾的是,如果富内斯想要正常发挥博闻强识的优势,那么他必须具备选择性沉默记忆的能力。综上所述,表观遗传系统的存在就是为了让基因组选择性地发挥作用,并且最终让细胞具备自身的个体特征,而生物体的个体特征或许只是机缘巧合的结果。
※※※
2006年,日本干细胞生物学家山中伸弥通过实验重置了细胞记忆,这也许是表观遗传学研究中最具说服力的典范。与格登一样,山中伸弥也对那些附着在基因上,可能记载细胞身份的化学标记产生了浓厚的兴趣。那么如果他把这些化学标记去掉会出现何种结果呢?成体细胞能否在彻底舍弃历史的基础上逆转发育过程变成原始的胚胎细胞呢?
山中伸弥再次与格登产生了交集,他也开始尝试细胞身份逆转的研究,只不过实验对象采用了成年小鼠的皮肤细胞。格登实验已经证实,卵子中的蛋白质与RNA等因子可以抹除成体细胞基因组上的化学标记,从而逆转细胞的命运并通过青蛙细胞培养出蝌蚪。山中伸弥打算从卵细胞中鉴别与分离出这些因子,然后准备让它们作为操纵细胞命运的分子“擦除器”。经过数十年的努力,山中伸弥将这些神秘因子缩小到仅由四个基因编码的蛋白质。接下来,他通过技术手段将上述四个基因转入成年小鼠的皮肤细胞中。
该实验的结果不仅令山中伸弥感到意外,而且还让全世界的科学家为之震惊,转入成熟皮肤细胞的四个基因使一小部分细胞获得了类似于胚胎干细胞的功能。这种干细胞既能够产生皮肤细胞,也可以分化成为肌肉、骨骼、血液、小肠与神经细胞。实际上,它们能够分化成为整个生物体中所有类型的细胞。山中伸弥与同事们仔细分析了皮肤细胞逆转(或者称之为“回归”)成胚胎样细胞的原因,他们发现该过程由一系列级联事件所组成。基因电路的激活或抑制将导致细胞代谢发生重置,随后表观遗传标记会被抹除并得到重写,同时细胞也会调整其形状与大小。原有的皱纹不见踪影,僵硬的关节恢复柔韧,我们仿佛看到青春再现,而细胞也将重新登上沃丁顿景观中的斜坡。山中伸弥终于可以抹去细胞的记忆来逆转其生物钟了。
不仅如此,该研究还取得了其他意外的收获。山中伸弥用来扭转细胞命运的四种基因之一被称为c—myc。14 myc基因并非等闲之辈,它不仅是一种重要的再生因子,同时也是生物学中功能最为强大的细胞生长与代谢调控调节因子。当该基因被异常激活后,它可以诱导成体细胞转化为胚胎样状态,从而使山中伸弥的胚胎逆转实验成为可能(这种功能只有在其他三个基因的协同配合下才可以实现)。但是myc也是生物学中最具危险的致癌基因之一,它在白血病、淋巴瘤、胰腺癌、胃癌以及子宫癌中表现为异常激活。就像某些古代寓言指出的那样,追求青春永驻将付出惨痛的代价。虽然此类基因可以让细胞摆脱死亡与年龄的束缚,但是它们也会将其命运引向永生化与无限增殖的泥潭,而这些都是恶性肿瘤所具有的典型特征。
※※※
根据基因与基因组调控蛋白的研究结果,我们终于理解了荷兰冬日饥荒及其后续影响的发生机制。毫无疑问,对于那些在1945年遭受急性饥饿折磨的人来说,他们体内参与能量代谢与储存的基因表达已经发生了变化。起初这种变化的作用时间非常短暂,可能只涉及环境中营养成分变化基因的启动或关闭。但是随着饥荒持续的时间进一步延长,人体内的代谢模式也将逐渐固化下来,当这种瞬间的变化凝聚成永恒之后,它们就会在基因组上留下印记。食物长期匮乏的信号通过激素在器官之间弥散,并且会导致体内重组基因的过度表达。在此过程中,细胞内的蛋白质会想方设法拦截此类信号,而附着于DNA上的印记将协助它们逐个关闭基因。这就像屹立在风暴之中的房屋,如果想要保护建筑物不受破坏,那么只能把基因发挥作用的路径完全封死。无论是基因上附着的甲基化标记,还是经过化学修饰的组蛋白,它们都记载着冬日饥荒的回忆。
为了适应恶劣的生存环境,人体内的细胞与器官均需要经过重新编程。最终,就连精子与卵子这些生殖细胞上也出现了此类标记(我们并不清楚精子与卵子携带饥饿应答记忆的原因与机制;也许对于生殖细胞来说,人类DNA中某些古老的通路记录了饥饿或贫困)。[9]当这些精子与卵子结合孕育出子孙后代时,它们形成的胚胎也可能携带有此类标记,以至于在冬日饥荒过去数十年后,代谢性改变依然铭刻在他们的基因组内。综上所述,历史记忆就是按照这种模式转化成为细胞记忆的。
※※※
值得警惕的是,表观遗传学也正处于某种危险观念的边缘。虽然基因经过表观遗传修饰后可能在细胞与基因组上叠加历史与环境信息,但是这种特殊的能力不仅颇具风险且结果难以预测:饥荒幸存者的后代可能会患有肥胖症与营养过剩,然而父亲患有结核病却不会改变孩子对于该病的应答。实际上,大多数表观遗传“记忆”是古老进化通路演绎的结果,我们不能将客观现实与主观愿望混为一谈。
就像20世纪早期的遗传学一样,表观遗传学目前也肩负着辨别垃圾科学与抑制疾病发生的使命。当我们面对这些旨在改变遗传信息的手段(饮食、暴露、记忆与治疗)时,不禁想起了李森科使用休克疗法获得高产小麦的荒谬尝试。在现实生活中,人们也希望女性在怀孕后通过保持心情舒畅来避免其子孙后代发生线粒体损伤。拉马克学说仿佛重振雄风并成为新时代的孟德尔定律。
总而言之,这些关于表观遗传学的肤浅概念理应招致怀疑。虽然环境信息可以铭刻在基因组上,但是其中大多数印记只反映了单个生物体细胞与基因组的“遗传记忆”,它们并不能在日后的繁衍过程中薪火相传。假如某人在意外中失去一条腿,那么该事件将在细胞、伤口以及瘢痕中留下印记,但是此类结果并不会导致其后代的下肢出现短缩,就像我与孩子们也没有受到家族中精神异常亲属的拖累。
虽然墨涅拉俄斯(Menelaus)曾经告诫说,祖先的血脉正在从我们体内消失,但是幸好他们的瑕疵与罪孽也一同逝去。因此我们对于这种安排理应庆贺而不是懊悔。基因组与表观基因组存在的意义在于,它们可以跨越细胞与世代的时空来传承相似性与历史记忆。而基因突变、基因重组与记忆消除则可以拮抗这些力量,并且推进差异、变化、畸形、天赋与再造的产生,同时在继往开来的过程中为更加辉煌的明天开辟崭新的道路。
※※※
可想而知,基因与表观基因在人类胚胎发生中起着相互配合的作用。现在让我们再回到摩尔根的问题上来:单细胞胚胎是如何发育成为多细胞生物体的呢?当受精作用完成几秒钟后,胚胎就开始迅速发育。与此同时,各种蛋白质也会蜂拥进入细胞核,并且逐步影响基因开关的启动与关闭,仿佛沉寂在太空的飞船突然焕发出勃勃生机。尽管上述基因表达会受到激活与抑制的影响,但是它们编码的蛋白质又会激活或抑制其他基因。现在单个细胞开始按照倍增的方式分裂形成中空的胚泡,接着参与协调细胞代谢、运动、命运以及身份的基因纷纷开始启动,随后细胞内部的各种通信线路也正式投入使用。整个过程就像锅炉缓慢升温与灯光明暗闪烁一样秩序井然。
现在这种第二遗传密码可以让细胞中的基因表达恰到好处,并且使每个细胞都能够获得固定的身份。对于某些特定基因来说,增减化学标记可以单独调节它们在细胞中的表达。例如,DNA甲基化与组蛋白修饰均可起到抑制或激活基因的作用。
随着胚胎继续发育,原始体节会被细胞取代。当新近合成的基因发出肢体与器官分化指令后,单个细胞基因组上会出现更多的化学标记。而这些附有化学标记的细胞日后将形成不同的器官与结构:例如前肢、后肢、肌肉、肾脏、骨骼以及眼睛等。在胚胎发育期间,某些细胞会出现程序性死亡。与此同时,维持细胞功能、代谢与修复的基因开始启动。于是单个细胞就逐渐成长为生物体。
※※※
亲爱的读者们,请不要被这些描述蒙蔽或误导,产生“我的天啊!这个过程太复杂了!”之类的想法,并因此认为没有人能够在深思熟虑之后理解、破译或操纵这些机制。
当科学家低估了复杂性的危害时,他们将会遇到事与愿违的结果。而这种失败的案例在科学实践中比比皆是:例如控制虫害的外来物种却成为入侵者;原以为增加烟囱高度可以缓解城市污染,殊不知空气中颗粒物排放的提升反而加剧了污染;本来希望通过促进造血来预防心脏病发作,但是却没想到血液黏稠度上升会增加心脏血栓的风险。
然而当普通人高估了复杂性的难度并且感觉“谜题无人能解”时,他们又会陷入意想不到的泥潭。20世纪50年代早期,某些生物学家曾经坚信遗传密码具有环境依赖性,他们认为这种错综复杂的关系完全取决于特定生物体中的特定细胞,而试图破解遗传密码的想法简直就是天方夜谭。后来人们发现事实恰恰相反:只有一种分子能够携带这种在生物界通用的遗传密码。如果能够掌握这种密码的规律,那么我们就可以对生物体甚至人类进行定向改造。同样在20世纪60年代,许多人都怀疑克隆技术能否实现基因在物种之间的互换。而直到1980年,人们还无法借助细菌细胞来合成哺乳动物蛋白,或者通过哺乳动物细胞来合成细菌蛋白;按照伯格的话来说,这些事情实在“简单得可笑”。其实不同物种往往似是而非,“自然”不过是“虚张声势的伪装”。
由于遗传指令在人类起源中的角色非常复杂,因此我们至今对于其详细的调控机制仍然一无所知。如果社会科学家一味强调形态、功能或命运取决于基因与环境的交互作用(基因并非是唯一因素),那么他实际上低估了主控基因决定生理状态与解剖结构的强大自主能力。如果人类遗传学家认为“多基因控制的复杂状态与行为并不遵循遗传学规律”,那么这位遗传学家就低估了基因的力量(例如能够“重置”整个生命状态的主控基因)。假如激活四个基因就可以使皮肤细胞转化为多能干细胞,假如某种药物可以彻底改变大脑的身份,假如单个基因发生突变就可以使性别与性别认同发生转换,那么无论是人类基因组还是我们自身都比想象中的要更容易改变。
※※※
我曾经在前述章节中写到,技术只有在促成转换时才能彰显其强大的推动力:例如,直线运动与圆周运动(车轮)之间,或者是现实与虚拟(网络)之间的转换。相比之下,科学的优势在于阐明组织规则与定律,其角色相当于透过放大镜对世界进行观察与分类。而技术专家努力通过这些转换将我们从现实的束缚中解放出来。科学在持续发展中不断推陈出新,并且界定了可行性范围的外部极限。与此同时,这些具有深远影响的技术创新也展现出人类征服世界的决心:例如,发动机(engine)源自拉丁语聪明(ingenium)或智慧(ingenuity)、计算机(computer)则源自拉丁语计算(computare)或推算(reckoning together)。与之形成鲜明对比的是,深奥的科学定律往往带有浓厚的认知局限性:例如,不确定性、相对性、片面性以及不可能性。
但是生物学却在所有学科中独树一帜:它从创建之初就缺乏可供参考的理论,就算到现在也很难找到普遍适用的定律。虽然芸芸众生都遵循物理与化学的基本原则,但是生命起源往往就存在于这些定律之间的边缘与空隙,并且一直在伺机突破它们的极限。宇宙在实现平衡的过程中会消耗能量、破坏组织甚至制造混乱,而生命的意义就是与这些力量进行抗争。为此人体采取的策略包括减缓反应、集中资源以及调整成分,整个过程就像我们每周三收拾即将送洗的衣服。詹姆斯·格雷克(James Gleick)写道:“有时看起来我们想要遏制宇宙混沌的目标根本不切实际。”15人们赖以生存的自然法则并非毫无破绽,我们依旧期待抓住机遇锐意进取。毫无疑问,自然法则仍然主宰着世间万物的运行规律,但是神奇的生命却始终在顽强地挑战极限并走向繁荣。即便是大象也不能违背热力学定律,它们巨大的身躯在运动中完成了特殊的能量传递。
※※※
生物信息的循环流动或许正是为数不多的生物学规律之一。
当然这种信息流动的方向也会出现例外(例如,逆转录病毒可以完成从RNA到DNA的逆向转换)。虽然在生物学世界中还存在某些尚未发现的机制,它们可能会改变生命系统中信息流的顺序或组成(例如,现在已知RNA能够影响基因调控),但是我们已经能够大致描述这些生物信息流的概念。
实际上,这种信息流可能已经非常接近我们需要的生物学定律。当我们从技术上掌控了上述定律时,就会迎来人类历史上最深刻的变革,也就是即将实现对自身基因进行读写。
※※※
但是在展望基因组的未来之前,我们还是先回顾一下它神秘的过去。我们既不知道基因从何而来,也不清楚它们如何发展壮大,更不用说在众多可行的生物学方法中,选择这种信息传输与数据存储的原因。然而我们现在却可以在试管中为基因追本溯源。杰克·绍斯塔克(Jack Szostak)是一位态度温和的哈佛大学生物化学家,他用了20多年的时间希望能够在试管中构建自我复制的遗传体系。16
绍斯塔克的实验延续了斯坦利·米勒(Stanley Miller)的工作。17米勒是一位颇有远见卓识的化学家,他曾经将某些存在于原始大气中的基本化学物质混合后合成“原始汤”。20世纪50年代,米勒正在芝加哥大学从事研究工作,他将甲烷、二氧化碳、氨气、氧气以及氢气经通风孔引入到密闭的玻璃烧瓶中,并且在注入高温蒸汽的同时用电火花模拟闪电,然后通过循环加热与冷却烧瓶模拟原始世界变幻莫测的环境。而这个不起眼的烧瓶中凝聚了烈火与硫黄、天堂与地狱以及空气与水相互交融的精华。
当实验进行3周以后,人们并未从烧瓶中发现任何生命迹象,但是米勒却在这些历经高温放电的原料混合物(二氧化碳、甲烷、水、氨气、氧气以及氢气等)中发现了氨基酸(构成蛋白质的基本单位)与单糖的痕迹。研究人员在米勒实验的基础上又在原料中加入了黏土、玄武岩与火山岩,他们随后在产物中发现了脂质与脂肪结构的雏形,而其中甚至还包括RNA与DNA的化学成分。18
绍斯塔克认为,两种成分的机缘巧遇促成了基因从“原始汤”中横空出世。19首先,原始汤中产生的脂类彼此结合形成胶束,而这种中空的球状膜有点类似于肥皂泡,它可以将液体包裹起来并且参与构成细胞膜(某些脂肪与水溶液混合时就会自然凝聚成这种膜泡)。绍斯塔克的实验已经证明,此类胶束的作用类似原始细胞:如果研究人员能为它们提供更多的脂质,那么这些中空“细胞”的尺寸就会继续增大。它们将在运动中不断延展,同时纤细的凸起形成了胞膜边缘波动。
其次,在自组装胶束形成的同时,核苷(碱基A、C、G、U或其化学前体物质)也通过一系列化学反应组成了RNA链。虽然这些RNA链绝大多数并不具备自我复制的能力,但是在数以亿计不具备复制能力的RNA分子中,碰巧就有一个RNA分子奇迹般地完成了自我复制,或者说它根据自身镜像生成了一个拷贝(RNA与DNA分子固有的化学结构为镜像分子的产生创造了条件)。令人难以置信的是,这种RNA分子具有从化学混合物中富集核苷的能力,并且可以将其串联起来形成新的RNA拷贝,它实际上就是一种具备自我复制能力的化学物质。
接下来就到了彼此融合的阶段。绍斯塔克认为这个过程可能发生在某个池塘或者沼泽的边缘,而拥有自我复制能力的RNA分子与胶束就在这里发生碰撞。从理论上来讲,该事件具有决定性的意义:两种陌生的分子在偶然相遇后坠入情网,并从此开启了一段悠远漫长的姻缘。当具有自我复制能力的RNA进入正在分裂的胶束内部后,胶束就可以将RNA分子在隔离的同时保护起来,只允许RNA在安全的膜泡内进行特殊的化学反应。反过来,RNA分子又会启动编码有利于RNA—胶束单元自体繁殖的信息。随着时间推移,RNA—胶束复合物中编码的信息将会为生成更多的复合物创造条件。
绍斯塔克写道:“这种由原初生命体(protocell)演变出RNA的过程相对容易理解。在此阶段,原初生命体内将会逐步出现新陈代谢,它们可以利用结构简单且数量充裕的原材料合成营养物质。接下来,这些生物体也许会在化学百宝箱中增加蛋白质合成的功能。”20对于此类由RNA构成的原基因来说,它们可能已经掌握了诱导氨基酸成链与合成蛋白质的本领,也就是说,这种具有多种用途的分子机器可以使新陈代谢、自体繁殖与信息传递的效率得到极大提升。
※※※
那么离散的“基因”(信息模块)是何时以及为何出现在RNA链上的呢?难道基因从一开始就是以模块化形式存在的吗?还是说信息储存具有某种中间或者替代形式吗?尽管我们依然无法回答上述问题,但是也许信息论可以为破解迷局提供关键的证据。对于连续出现的非模块化信息来说,其麻烦之处在于管理起来十分困难。这种信息具有弥散、易损、无序、局限以及衰减的特点,并且它们之间的界线往往无法梳理清楚。如果来自四面八方的信息彼此交错在一起,那么系统将面临更加严重的失真风险,而这就相当于黑胶唱片上出现的严重凹痕。相比之下,“数字化”信息更容易得到修复与弥补。我们无须翻遍整个图书馆就能找到或修改书中的某句话。综上所述,基因的问世可能也是基于相同的道理:某条RNA链上呈离散分布的信息模块可以通过编码指令来满足离散与个体的功能。
然而信息的不连续性也会带来额外的优势:这可以让突变的影响只局限于某个基因,并且同时保证其他基因不被累及。现在突变将有针对性地作用于这些离散的信息模块,因此可以在不破坏生物体功能的情况下加速进化。但是上述优势也可能转化为弊端:如果突变数量过多,那么信息将会出现损坏或丢失。也许信息也需要某种备份拷贝,而这种镜像可以使信息在遭到损坏的时候得以保全或者恢复原型。当然这也可能是构建双链核苷酸的原动力。由于核苷酸链上的数据将在互补链中得到完美的映射,因此任何数据破坏都可以被重新修复,其作用就像是记载生命轨迹的硬盘存储器。
经过岁月漫长的磨砺后,DNA这种物质终于肩负起遗传信息原版拷贝的重任。虽然DNA由RNA演化而来,但是它很快就替代RNA成为基因的载体,并且在生命系统中发挥着至关重要的作用。[10]古希腊神话记述了父亲克洛诺斯(Cronus)被儿子宙斯(Zeus)推翻的经过,而这个故事仿佛也被铭刻在人类基因组发展的历史中。
[1] 沃丁顿起初把后成说(epigenesis)当作动词而非名词来看待,人们曾经用它来描述单个细胞发育成为胚胎的过程 ( “后成说”反映了不同类型细胞的胚胎发生过程,例如,神经元与皮肤细胞均来自原始受精卵。随着时间推移,“表观遗传学”逐渐引起人们的重视,它被用来描述细胞或者生物体在基因序列不变(例如基因调控)的情况下获得各种表型的途径。更为流行的说法是,在DNA序列不变的情况下,影响基因调控的DNA发生了化学或物理变化。某些科学家认为“表观遗传学”只适用于那些可遗传的改变,例如,从细胞到细胞或者从生物体到生物体,而“表观遗传学”捉摸不定的含义在该领域引起了巨大的困惑。
[2] 有些科学家认为冬日饥荒研究本身就存在偏倚:患有代谢性疾病的父母(例如肥胖症)可能会调整孩子的膳食选择,或者以某些非遗传的方式来改变他们的习惯。批评家则认为,此类代际“传递”的因子并不是遗传信号而是文化或膳食选择。
[3] 格登发明的技术(将成体细胞核移植到去核卵细胞中)已经在临床上得到了全新的应用。例如,某些女性会出现线粒体基因突变,而线粒体是细胞内产生能量的细胞器。我们之前曾经提到,人类胚胎的全部线粒体均是从母体(精子没有为后代贡献任何线粒体)卵子那里继承。如果母体携带有线粒体基因突变,那么其后代可能会受到该突变的影响;这些基因发生突变后通常会影响能量代谢,并且可以导致肌肉萎缩、心脏异常甚至死亡。2009年,经过一系列颇具争议的实验的验证,遗传学家与胚胎学家提出了一种应对这些母体线粒体基因突变的奇思妙想。当卵子与来自父体的精子结合后,他们将受精卵细胞核注入来自正常供体且含有完整(正常)线粒体的卵子。由于这些源自供体的线粒体基因均保持完整,因此新生儿将不会携带来自母体的突变,可是从理论上来讲他们应该具有三个父母。受精卵细胞核由“母亲”与“父亲”组成(第一与第二父母),他们提供了绝大部分遗传物质,而第三父母也就是卵细胞的供者只提供线粒体与线粒体基因。2015年,经过一场旷日持久的全国性辩论后,英国政府宣布将该技术合法化,现在第一批来自“三父母”的后代即将出生。他们代表了人类遗传学(与人类未来)中未知领域的前沿。显而易见,这种情况在自然界中尚无先例。
[4] 文森特·奥尔弗里(Vincent Allfrey)是洛克菲勒大学的一位生物化学家,他于20世纪60年代率先提出了组蛋白可能参与基因调控的观点。非常凑巧的是,就在他提出“组蛋白假说”30年后,同在洛克菲勒大学工作的阿利斯将利用实验手段来证实奥尔弗里的预见。
[5] 主控基因可以持续作用于靶基因,而这种自主性很强的机制被称为“正回馈”。
[6] 遗传学家蒂姆·贝斯特(Tim Bestor)与某些同事认为,DNA甲基化标记的主要作用包括灭活人类基因组中源自古代的病毒样元件、灭活X染色体(莱昂理论)以及对精子或卵子中的某些基因进行差异化标记,这样可以便于生物体了解并“记住”哪些基因源自父本或母本,而我们将该现象称为“印记”。值得注意的是,贝斯特并不相信环境刺激会对基因组产生显著效应。更准确地说,他认为表观遗传标记可以在发育与印记过程中调控基因表达。
[7] 随着甲基化分析方法不断提升,近期研究发现双胞胎之间的差异非常有限。与此同时,这个日新月异的领域目前仍存在较多争议。
[8] 遗传学家马克·普塔什尼对于表观遗传标记的持久性与记忆本质产生了怀疑。根据普塔什尼的观点(某些学者对此表示支持),之前被描述为分子开关的主控蛋白可以决定基因的激活或抑制。表观遗传标记是基因激活或抑制长期作用的结果,虽然它们可能在调节基因的激活与抑制中发挥辅助作用,但是基因表达的主要调节机制仍然需要通过这些主控蛋白来实现。
[9] 尽管蠕虫与小鼠实验证实了饥饿的跨代效应,但是我们并不了解这种效应是否会随着世代变迁而继续保持或逐渐衰退。某些研究认为,小RNA能够在代际传递信息。
[10] 某些病毒的基因仍然由RNA组成。