“缺啥补啥”遇到的新问题
诞生于1990年的基因治疗可谓命运多舛。在万众瞩目中降临世间的她,羽翼尚未丰满就遭遇了一连串打击,甚至带走了许多人的性命。一路跌跌撞撞走来,尽管人们对她仍然抱有美妙的期待,但是受限于病毒载体对人体免疫系统的攻击,受限于病毒对人类基因组序列的潜在危害,同时也受限于我们对复杂疾病遗传因素的理解,基因治疗技术的大规模推广应用看起来仍然是个遥不可及的幻想。
除了我们已经讲过的技术局限性之外,基因治疗还面临着另一重难以逾越的障碍。大家可能还记得,前面故事里讲到的基因治疗的应用场景,无一例外都是某个重要的人体基因出现突变,从而丧失功能。德希尔瓦身体里的腺苷脱氨酶基因突变丧失功能,导致了严重的免疫系统缺陷。而基辛格罹患的疾病,是由于鸟氨酸氨甲酰基转移酶基因出现遗传缺陷,影响了机体对蛋白质的正常代谢所致。对于类似这样的存在基因功能缺陷的单基因遗传病来说,“缺啥补啥”是一个足够好用的治疗思路。基因不好用?没问题,再补一个好的基因进去就是了!这个治疗逻辑虽然简单粗暴,但与营养不良就多吃点蛋白质、微量元素不足就吃微量元素片一样,确确实实能够挽救一些患有严重遗传病患者的生命。
在上面的故事里我们已经看到了“缺啥补啥”的一个与生俱来的技术问题。既然是“补”,那么我们必然需要给“补”进去的新基因在基因组上找一个落脚点。这个位置如果找得不够理想,甚至不小心破坏了人类基因组上某个原本正常的基因,基因治疗可能就会导致难以预料的新疾病。
而更进一步,如果某个遗传病不是因为某个基因出现缺陷、失去功能导致的,而是因为这个基因发生遗传变异,获得了某种不该有的新“功能”;或者增强了原来就有的旧“功能”,那么这种“缺啥补啥”的治疗思路就束手无策了。在这样的患者体内,其实并没有“缺”任何东西,反而是多出来了一些原本不该有的东西,要“补”也无从下手啊!
实际上,这样的单基因遗传病还真不少。例如,大家可能听说过鼎鼎大名的亨廷顿舞蹈症,这种疾病就是由于人体基因获得新“功能”导致的。亨廷顿舞蹈症可能是人类最早认识的遗传疾病之一,早在中世纪的欧洲就能找到相关症状的书面记载(特别是肢体不受控制地摇摆)。1872年,美国医生乔治・亨廷顿(George Huntington)在研究中发现,亨廷顿舞蹈症存在明显的遗传性。如果父母一方或双方患有该病,其子孙后代也会有相当大的患病可能。在此之后,人们进一步明确了亨廷顿舞蹈症和人类四号染色体短臂上一个名为HTT的基因有着直接联系。
HTT基因编码一种与之同名的蛋白质。这个HTT蛋白的确切功能,直到今天我们知道的都不是太多。但这个蛋白有一个惊人的属性,它能够与细胞内的许许多多(可能超过100种)蛋白质相互结合。因此人们猜测,HTT蛋白可能是多种蛋白质分子的“载体”或“载具”,协助它们在细胞内的产生、运输、发挥功能、降解,等等。这个HTT基因有一个非常特别的属性。它的DNA序列中有不少C-A-G 3碱基的重复序列,根据中心法则,C-A-G 3碱基组合正好可以编码一个特定的氨基酸——谷氨酰胺。因此,HTT蛋白中也就相应地含有一连串的谷氨酰胺。细胞内负责DNA复制的蛋白质分子遇到不断重复的碱基序列时经常会出错。出错原因倒是不难理解,就像我们身处一座每个街区都长得一模一样的城市,大概也难免会有点路盲症吧。因此,每个人体内HTT基因上C-A-G重复序列的个数,也就是HTT蛋白中谷氨酰胺的个数,会多少有些不同,几个、十几个或二十几个重复序列都会出现。
一般而言,这些数量波动不太会影响HTT蛋白的正常功能。但是一旦HTT基因中C-A-G 3碱基重复的数量超过某个阈值,HTT蛋白的功能就会被永久性改变。这些HTT蛋白当中的超长谷氨酰胺重复序列,具有一种可怕的能力:它们可以自发形成巨大的蛋白聚合体。许许多多HTT蛋白能够通过各自的超长谷氨酰胺重复序列两两交联,积沙成塔,构成一个巨大的蛋白三维网络。最终,这个密如蛛网的蛋白网会裹挟着其他与之相结合的蛋白质形成巨大的块状沉淀,在电子显微镜下清晰可见。伴随着这一过程,神经细胞的正常功能乃至生存就会受到严重干扰。随着病程的深入,大脑许多区域会随着神经细胞的不断死亡而萎缩并失去功能。其中突变HTT蛋白影响最深的区域叫作纹状体,它正是控制肢体运动的中枢之一(见图3-1)。因此,亨廷顿舞蹈症患者最早出现的症状正是肢体不受控制地随机舞动,而这也是这种绝症名称的由来。
图3-1 罹患亨廷顿舞蹈症患者的脑区会出现明显萎缩
从图中可见,亨廷顿舞蹈症患者(左)的脑体积明显缩小,相应的脑室(图中黑色的空腔)体积明显增大。
亨廷顿舞蹈症很好地诠释了一种无法靠“缺啥补啥”的思路解决的遗传病类型。在这种疾病中,遗传变异让HTT蛋白获得了某种它本来并不具有的对神经细胞危害甚大的新“功能”,这是一种通过超长谷氨酰胺链形成巨大的蛋白多聚体的能力(见图3-2)。我们很容易理解,单纯利用基因治疗的逻辑向患者身体内运送一个“正常”的HTT基因,是无法阻止细胞内原有的突变HTT蛋白继续聚集沉淀的。
图3-2 亨廷顿舞蹈症的遗传基础
在患者体内,HTT基因出现了大量的C-A-G 3碱基重复(37~80个),从而导致HTT蛋白中出现了大量的谷氨酰胺重复(深色球体)。这种存在遗传缺陷的HTT蛋白会在细胞内形成块状沉淀,导致神经元的死亡和人体运动机能的失控。
那么我们该怎么办呢?“缺啥补啥”的粗暴手术思路不能解决问题,于是人们的目光开始转向对人类的遗传物质进行更为精细的手术操作。“基因编辑”的概念应运而生。
与传统基因治疗的思路不同,基因编辑的逻辑在于通过某种外科手术式的精确操作,精确修复出现遗传变异的基因,从根本上阻止遗传疾病的产生(见图3-3)。从某种程度来说,传统基因治疗就像在给濒危建筑打加强筋、装防震梁,只要可以延长它的使用寿命就行;而基因编辑就像是要修葺故宫三大殿,需要严格按照原样“修旧如旧”,还需要把建筑中糟朽不堪的零件取出修缮甚至替换,再原封不动地安装回去,目标是让整座建筑精确地恢复原有的机能。两种思路从指导思想到技术路线的差异可想而知,而难度更是不可同日而语。
比如说,既然亨廷顿舞蹈症患者体内的HTT基因多了几个不合时宜的C-A-G碱基重复,那把多余的C-A-G重复删除掉就能治疗疾病。而基因编辑的用途显然不止于此。比如说,我们也知道,镰刀形红细胞贫血症患者体内的HBA基因上,第20位的碱基A被替换成了T,我们只要找到这个错误的碱基,小心翼翼地把T重新换成A就万事大吉。以此类推,对于任何一种单基因遗传病,只要我们能够找到出现错误的DNA序列,精确地把错误序列修正,就可以治疗疾病了。
也就是说,基因编辑能解决传统基因治疗所解决不了的问题,就算是那些通过“缺啥补啥”的传统基因治疗思路能解决的问题,基因编辑也能解决得更精确、更漂亮。把它称为下一代的基因治疗只怕不算过分。唯一的问题是,到底怎么实现对基因的精确编辑呢?
仅从逻辑上说,编辑基因的任务并不复杂。实际上,如果把人类基因组DNA放大几亿倍——那么DNA会有几十万千米长,每个碱基分子就会有足球那么大了——基因编辑的手术操作将会变得非常简单和直观。我们只需要用肉眼寻找到DNA长链上需要编辑的位置,拿一把剪刀剪两个断口,把错误的DNA片段拿出来,换上正确的序列,再用针线缝补好就行了。
然而在纳米(十亿分之一米)和埃(百亿分之一米)的微观尺度下,别说肉眼能看到的剪刀和针线了,人类目前所能设计和制造的所有微型机器都显得过于粗大、笨重和低效率。先说锁定目标这一步,要知道,人类基因组DNA上约有30亿个碱基对,如果要通过阅读一个一个的碱基,在其中找到那个特别需要修正的“问题”碱基,一目十行也要读到头晕眼花甚至地老天荒才找得到。更不要说基因组DNA在细胞内形成了极其复杂的三维结构,即便是你愿意一个一个碱基按顺序读下来也做不到。再说修复这一步,用纯粹机械论的逻辑来规划,替换掉一个出错的碱基,至少需要这么几步:首先要用一双锋利无比、能剪长度只有几埃的化学键剪刀,把这个问题碱基前后相连的碱基咔嚓咔嚓剪掉;之后用一只机器手抓起问题碱基扔到垃圾桶,再抓来一个正确的碱基分子;最后,用无比精细的针线把这个新碱基重新与前后的碱基缝起来,让它们重新形成一条完整的DNA分子。这远远超越了人类当前的知识和技术储备。
不过聪明(或者说“懒惰”)的生物学家又一次成功地“投机取巧”了:和以往一样,他们借用了大自然的力量。他们没有闷头去设计可能永远也造不出来的纳米机器人,而是在自然界寻找亿万年进化中衍生出的天然剪刀、机器手和针线。
图3-3 基因编辑的基本逻辑
①对于存在遗传缺陷的基因组,②需要首先定位出现错误的片段,③再将错误片段剪下,④并替换成正确片段。
目前在生物医学领域大行其道的重要工具,绝大多数都来自大自然的鬼斧神工,而非实验室中的人工设计。前文中帮助我们传递救命DNA的,是有着高超的细胞入侵能力的小小病毒。在全球数不清的生物实验室里,生物学家用一种能够在紫外光照射下发出幽幽绿光的蛋白质——绿色荧光蛋白——追踪细胞中各种物质的产生、运输和定位(见图3-4)。绿色荧光蛋白并非人类的智慧创造,而是脱胎于一种能够发出幽幽绿光的海洋生物——维多利亚多管发光水母。
图3-4 实验室中创造出的各色荧光蛋白
它们最早脱胎于维多利亚多管荧光水母体内天然存在的蛋白质——绿色荧光蛋白,今天已经成为生物学研究的利器。
在肿瘤科病房里,医生们用能够准确结合癌症相关蛋白的单克隆抗体治疗癌症。抗体分子之所以有特异识别和结合蛋白质的能力,是因为它们在生物体中本来就被用于高效识别入侵人体的各种抗原分子,铸成了人体免疫系统的钢铁长城。大家从新闻媒体上获知的转基因抗虫棉,是科学家们把一种由细菌天然制造的毒杀鳞翅目昆虫的蛋白质,通过转基因技术表达在棉花中实现的。甚至连植物转基因技术本身,很大程度上也依赖于一种天然能够感染植物并将自身遗传物质输入植物细胞中的生物——农杆菌。
而这一次,大自然又给我们送来了一根“黄金手指”——名为锌手指蛋白(Zinc Finger,学名锌指蛋白)的一种蛋白质分子。这根“黄金手指”的功能,就像是人类基因组中的GPS。只要输入我们想要寻找的基因组序列,它就能够帮助我们快速而精确地定位。你们马上将看到,这种精确定位的能力,将成为整个基因编辑领域的基石。这根“黄金手指”,将会稳定地操起上帝的手术刀。
在本书的开头,我们已经讲过遗传物质对于生命现象的重要性。每个人独一无二的性状,从身高、体重到头发颜色、单双眼皮、血型,再到性格情绪和学习能力,或多或少都受到这些遗传物质的影响。在我们的每一个细胞深处,都包含超过30亿个碱基对、两万多个基因的人类基因组。它们负责制造数万种序列和功能千差万别的蛋白质,从而决定着每一个细胞、每一个组织和器官、每一个人类个体的性状。
那么问题来了。人体是由近百万亿个细胞构成的。每个细胞中存储的基因组DNA几乎是完全一致的,而每种细胞所合成制造的蛋白质却是千差万别的!红细胞制造大量的血红蛋白用于携带氧气,胰岛β细胞制造和分泌胰岛素调节血糖,毛囊细胞不停地制造角蛋白用于毛发生长……几乎一模一样的DNA,是怎样指导了五花八门的蛋白质合成,从而衍生出了不同的细胞类型呢?
这背后的生物学机理可以写成一本厚厚的教科书,我就不在这里不自量力地展开陈述了。但有一个特别重要的机制不能不提:有一类被称为转录因子的蛋白质分子,它们表现得就像是基因组的活地图和开关一样。在不同种类的细胞中,它们能够寻找、定位并结合到特定基因的DNA序列上,控制基因在不同时间、不同地点、不同环境条件下生产RNA和蛋白质的速度。打一个过度简化的比方,同样的一套遗传物质之所以会让胰岛β细胞而不是毛囊细胞或者其他任何类型的细胞合成胰岛素,可能是因为有一个控制胰岛素基因开关的转录因子蛋白,仅仅存在于胰岛β细胞中。这个转录因子能准确识别并结合在胰岛素基因序列的附近,启动胰岛素基因表达和胰岛素生产。
可想而知,转录因子蛋白的看家本领,就是准确识别和结合特定DNA序列的能力(见图3-5)。这一特性保证了转录因子可以精确地调控一个基因在不同时空中的活性。在下文中我们将会详细说明这一特性的临床意义。
图3-5 转录因子蛋白(紫色)结合DNA双链(绿色)的想象图
你可能已经想到,转录因子的这种精确定位能力,是不是可以帮助我们进行基因编辑呢?转录因子既然可以在人类30亿个DNA碱基对的海洋里准确找到它需要结合和调节的基因序列,这个能力能不能帮助我们找到需要定位和修改的缺陷碱基,从而修复病人身上的遗传缺陷呢?如果你能想到这个,其实已经很接近事实的真相了。不过,这里面还有一个明显的技术障碍。
要知道,转录因子和它们所负责的基因之间并不是一对一的简单对应关系。实际上,人体中存在的转录因子蛋白可能也仅有1 000多种,远少于人类基因的数量。因此,转录因子和基因之间往往有着复杂的对应关系,一个转录因子可能同时可以识别和调节几个乃至上百个基因表达,而一个基因的活性往往又受到好多个转录因子的共同影响。为了实现基因组的精确编辑,治疗单基因遗传病,我们需要的是能从30亿个碱基对中准确定位其中唯一的致病基因序列的方法。天然存在的转录因子的定位精度明显不够用。
但我们的“黄金手指”——锌手指蛋白有着无与伦比的奇妙特性。作为一类特殊的转录因子,锌手指蛋白当然可以定位基因组的特定序列。科学家们发现,如果对天然存在的锌手指蛋白拆散重组,可以获得全新的基因组定位能力。如果有足够大量的锌手指蛋白组合,我们甚至可以从中创造出针对任意长度、任意组合的碱基序列的锌手指蛋白来!“黄金手指”这个昵称,锌手指蛋白当之无愧。