- 读书 >
- 全球科技通史 - 吴军 >
- 第四篇 现代科技 >
- 第九章 信息时代
从豌豆杂交开始的基因技术
“遗传”和“基因”这两个词对于今天的人来说再普通不过了,它们经常在媒体上出现,即便对它们的含义未必有非常准确的理解,大意大家都明白。然而退回到100多年前,人们虽然能看到遗传现象,也注意到一些遗传规律,比如男性色盲人数要比女性多得多,但并不明白遗传是怎么回事,更不明白物种为什么能继承父辈的很多特征。
最早试图回答这些问题的是19世纪奥地利的教士孟德尔(Gregor Johann Mendel,1822—1884)。孟德尔从年轻时起就是神职人员,他坚信上帝创造了我们这个丰富多彩的世界,但是同时,他怀着一颗无比虔诚的心,试图找到上帝创造世界的奥秘。29岁那年,孟德尔获得了进入奥地利的最高学府维也纳大学全面学习科学的机会。在那里,他系统地学习了数学、物理、化学、动物学和植物学。31岁时,他从维也纳大学毕业并返回修道院,随后被派到布鲁恩技术学校教授物理学和植物学,并且在那里工作了14年。在此期间,孟德尔进行了他著名的豌豆杂交实验。
孟德尔选用豌豆做实验主要有两个原因。首先是豌豆有很多成对出现、容易辨识的特征。比如从植株的大小上看,有高、矮植株两个品种;从花的颜色来看,有红、白两种;从豆子的外形看,有表皮光和表皮皱两种。其次是豌豆通常是自花受精,也叫闭花授粉,不易受到其他植株的干扰,因此品种比较纯,便于做实验比较。孟德尔在几年时间里先后种了28000株豌豆,做了很多实验,发现了两个遗传学规律。
首先,决定各种特征的因子(当时他还不知道“基因”这个概念)应该有两个,而不是一个,其中一个是显性的(比如红花),另一个是隐性的(比如白花),这被他称为“显性原则”。在授粉时,每一亲体分离出一个因子留给后代。对于后代而言,只要有一个是红花的因子(显性的),它就呈现出红花的特性,而白花的因子是隐性的,除非两个都是隐性的白花因子,否则表现不出来。
豌豆从双亲获得遗传因子对和植株在颜色上的表现如表9.1所示。
表9.1 豌豆遗传因子和花的颜色的对应关系
这就解释了孟德尔在第一代纯种的红花豌豆和白花豌豆的杂交实验时,得到的杂交豌豆(第二代)花的颜色全都是红的,因为它们的遗传因子一红(显性)一白(隐性);而再用杂交(红花)豌豆接着繁衍后代(第三代),却有1/4是白的,因为有1/4的遗传因子是两个白的隐性因子。由于两个遗传因子在繁殖时要分离,这个规律也被称为遗传学的“分离定律”。
▲图9.14 左图为第一代纯种红花豌豆与纯种百花豌豆杂交的情况,右图为第二代杂交后得到的红花豌豆继续繁殖的情况
其次,孟德尔还发现,如果将豌豆植株按高矮和颜色两个特性混合杂交实验,结果豌豆的多种遗传特征在遗传时,彼此之间没有相互影响,他把这个发现称为自由组合定律。
由于孟德尔并不是职业科学家,他和学术界鲜有来往,因此他的研究成果在1896年发表后的35年里都鲜为人知,孟德尔的论文在此期间仅被引用了3次。直到1900年,孟德尔的研究成果才得到学术界的认可,这距孟德尔去世已经16年了。当然,这也得益于他以论文的形式发表研究成果,才让后人有机会了解到这位遗传学先驱的工作。
孟德尔还做了类似的动物实验,可能并不成功,也没有留下什么有意义的结果。在动物实验中证实孟德尔的理论,并且由此建立起现代遗传学的是美国科学家摩尔根(Thomas Hunt Morgan,1866—1945)。
摩尔根出身于美国马里兰的一个名门望族,父母双方上几辈中出过很多政治家、将军和其他社会名流。但是摩尔根并没有像他父母所期望的那样去从政,而是一生致力于科学研究。后来他自嘲道,他的基因变异了。1890年,摩尔根从约翰·霍普金斯大学获得博士学位,他专攻的是生物学。1904年,他在哥伦比亚大学担任教授,研究兴趣转到了遗传学上。
在摩尔根的时代,很多生物学家都试图在动物身上验证孟德尔的理论,但是都不成功,其中一个重要的原因是实验对象没有选好。大家尝试用老鼠做实验,结果杂交得到的后代五花八门,以至不少人对孟德尔理论的普遍性产生了怀疑,摩尔根也在其列。不过摩尔根意识到,实验失败的原因可能是老鼠彼此之间的基因相差太大所致,而非孟德尔的理论出了错,于是他改用基因简单(这样噪声少)、繁殖快的果蝇进行遗传实验。果蝇这种小飞虫两个星期就能繁殖一代,而且只有4对染色体,因此直到今天都是做实验的好材料。但是果蝇不像豌豆那样特征明显,要在小小的果蝇身上找到可对比的不同特征并不容易。摩尔根通过物理、化学和放射等各种方式,经过两年的培养,终于在一堆红眼果蝇中发现了白眼果蝇,从此开始进行果蝇杂交实验,并证实了孟德尔的研究成果。
随着对后来一系列果蝇遗传突变的研究,摩尔根首先提出了“伴性遗传”(sex-linked inheritance)的概念,即在遗传过程中的子代部分性状总是和性别相关,例如色盲和血友病患者多为男性。发现伴性遗传后,摩尔根经过进一步研究发现了基因的连锁和交换。
我们知道一个生物的基因数目是很大的,但染色体的数目要小得多。以果蝇为例,它只有4对染色体,而当时经摩尔根发现和研究的果蝇基因就有几百个,因此一条染色体上存在着多个基因。基因连锁的意思是,在生殖过程中只有位于不同染色体上的基因才可以自由组合,而同一染色体上的基因应当是一起遗传给后代,在表现上就是有一些性状总是相伴出现,它们组成一个连锁群。
在发现基因连锁的同时,摩尔根还发现,同一连锁群基因的连锁并不是一成不变的,也就是说,不同连锁群之间可能发生基因交换。此外,他还发现在同一条染色体上,不同基因之间的连锁强度也不同,距离越近则连锁强度越大,越远则发生交换的概率越大。后来,人们把摩尔根的这个理论称为基因的连锁互换定律。摩尔根不但成功地解释了困扰人类几千年的伴性遗传疾病问题,而且最终建立起了完善的现代遗传学理论。
1933年,摩尔根被授予诺贝尔生理学或医学奖。后来,为了纪念摩尔根对遗传学的贡献,遗传学界使用他的名字“摩尔根”作为衡量基因之间距离的单位,并且将遗传学领域的最高奖也命名为“摩尔根奖”(Thomas Morgan Medal)。
摩尔根开创了现代遗传学,却也给后世留下了一系列谜团:基因到底是由什么构成的(或者说它里面的遗传物质是什么)?它的结构是什么样的?是什么力量让它能够连接在一起,在遗传时又为什么会断开?基因又是怎么复制的……
今天我们知道基因里面的遗传物质是由DNA构成的,人类从观测到DNA到确定它为基因的遗传物质并搞清楚它的结构,花了将近一个世纪的时间。早在1869年,一位瑞士医生就在显微镜下观测到细胞核中的DNA,由于DNA是在细胞核中被发现的,“核酸”一词因此得名。但是当时人们并没有将它和遗传联系起来。1929年,美国俄裔化学家莱文(Phoebus Levene,1869—1940)提出了关于DNA的化学结构的一些假说,其中一部分假说后来被证明是正确的,比如DNA包含4种碱基、糖类以及磷酸核苷酸单元,但是DNA分子是怎么排列的,莱文并不清楚。
1944年,洛克菲勒大学(当时叫洛克菲勒医学院)的三名科学家埃弗里(Oswald Theodore Avery,1877—1955)、麦克劳德(Colin Munro MacLeod,1909—1972)和麦卡蒂(Maclyn McCarty,1910—2005)证实DNA承载着生物的遗传因子,并且分离出纯化后的DNA。遗憾的是,埃弗里等人却没有获得诺贝尔奖,这是因为埃弗里并不善于宣传自己,以至诺贝尔奖委员会没有意识到他们工作的重要性,再加上个别评委对这个领域不是很擅长,于是早早地就将埃弗里等人的工作筛选掉了。后来,诺贝尔奖委员会就这件事专门向埃弗里道了歉。
在确定DNA是遗传物质后,科学家的研究就转向寻找DNA的分子结构和它的复制原理。这个秘密的破解有着极其重要的生物学和哲学意义。在生物学上,它可以让我们了解生命的本质和起源;从哲学上讲,它有希望回答“我们从哪里来”“我们是谁”这两个难题。
第二次世界大战结束后的10年,即从20世纪40年代末到50年代末,是生命科学和医学发展最快的时期,很多重要的发明发现都出现在这个时期。除了破解抗生素的分子结构并且实现了人工合成抗生素,科学家还发现了DNA的结构,发明了利用限制酶切割DNA的技术,发现了RNA(核糖核酸)的结构以及DNA–RNA杂交的机制。如此多的重大成果能够在极短的时间里取得,主要有两个原因。首先是仪器的突破,特别是电子显微镜(包括X射线衍射仪)的出现,使得生物学的研究从细胞级别进入分子级别。其次,也可能是更重要的原因,就是大量顶级的物理学家和一些顶尖的化学家(比如莱纳斯·鲍林)转行到了生物领域,大量年轻学者也选择了生物专业。而这个趋势的形成要感谢一个人,就是著名的物理学家薛定谔。他写的科普读物《生命是什么》让很多科学家和年轻学者决定投身生物学研究。
1946年,受到薛定谔的影响,在二战中负责盟军雷达技术的物理学家兰德尔将他负责的英国伦敦大学国王学院物理系的研究方向转到生物物理上。兰德尔手下的化学家罗莎琳德·富兰克林(Rosalind Franklin,1920—1958)、物理学家威尔金斯(Maurice Wilkins,1916—2004)和富兰克林的博士生戈斯林首先通过X射线衍射仪得到了DNA的结构照片,但是他们没有很好地提出关于DNA的模型结构。
事实上,当时英国主要有两个实验室从事DNA的结构研究,一个是兰德尔领导的国王学院物理系,一个是剑桥大学著名的卡文迪实验室,当时该实验室负责人是英国物理学家小布拉格。国王学院和卡文迪实验室团队之间虽然有所交流,但是为了率先破解DNA之谜,他们彼此保密,暗中较劲。
1951年,当时还是博士生、后来成为生物分子学家的克里克(Francis Crick,1916—2004)加入了卡文迪实验室,并在小布拉格的指导下,与从美国前来学习的詹姆斯·沃森(James Watson)共同研究DNA的模型结构。
相比兰德尔的团队,小布拉格手下的两个新人沃森和克里克不仅显得稚嫩,而且他们当时的生物学造诣都不是很高,也不是X射线衍射方面的专家。在观察DNA结构、获取实验数据(照片)方面,自然比不上兰德尔的团队。不过,作为生物学领域的新人,两人都敏而好学,不耻下问,心态开放,愿意接受新的理论,他们甚至还去请教兰德尔团队的成员。
当然,沃森和克里克也有他们的学科优势。沃森化学基础相对较好,而克里克的物理学背景对他在生物学上的研究帮助也很大。克里克后来回忆说,长期的物理学研究帮助他掌握了一整套科学的方法,这种方法与学科无关。克里克还认为,正因为他原本不是学生物的,才会比典型的生物学家更加大胆。更重要的是,沃森和克里克与富兰克林和威尔金斯等人的思维方式不同,后者希望通过X射线衍射看出DNA的结构,而这两个初出茅庐的人则不断想象着DNA可能的合理结构,他们是先构想结构,然后再用X射线衍射图片去验证。
当然,沃森和克里克研究出来的模型离不开数据的验证。兰德尔团队等人自然不会直接把数据提供给沃森和克里克使用,不过兰德尔拿了英国政府医学研究委员会的研究经费,需要向委员会汇报研究成果,因此沃森和克里克通过委员会获得了兰德尔团队的数据。最终,沃森和克里克在综合了很多科学家的工作后完成了DNA分子结构的研究。
1953年4月,在兰德尔和小布拉格的协调下,《自然》杂志同时发表了两个实验室3篇关于DNA研究的重要论文,它们分别是沃森与克里克的《核酸的分子结构》、威尔金斯等人的《脱氧核酸的分子结构》以及富兰克林与戈斯林的《胸腺核酸的分子结构》。沃森与克里克在论文中虽然提及他们受到了威尔金斯与富兰克林等人的启发,但并没有致谢。而威尔金斯与富兰克林则在论文中表示自己的数据与沃森和克里克的模型相符。鉴于此,学术界一直对沃森和克里克颇有微词。
1962年,沃森、克里克和威尔金斯因为发现DNA的分子结构而获得诺贝尔生物学或医学奖。遗憾的是,富兰克林因为1958年早逝,与诺奖失之交臂。在20世纪所有的诺贝尔生物学或医学奖中,DNA结构的发现被认为是最有价值的一个奖项。
了解了DNA的分子结构,不仅使人类破解了生物遗传的奥秘,而且有助于解决很多医学、农业和生物学领域的难题。关于这一点,我们在下一章还会详细论述。
● ● ●
对比19世纪和20世纪的科技发展,前者更多的是以能量为驱动力,而后者则是以信息为中心。信息无论在产生、传输还是使用上,都呈现指数级暴涨态势,特别是在计算机出现之后。1946年,世界上第一台计算机“埃尼亚克”的处理能力为每秒5000次运算,2018年6月,美国橡树岭国家实验室(ORNL)发布的新一代超级计算机“顶点”每秒能进行多达20亿亿次(200PFlops)运算。1956年第一条跨大西洋的电话电缆TAT–1成功开通的时候,通信的速度仅72Kbps(36路4KHz的信道),而当西班牙电信、微软和脸书在2018年2月开通最新的跨大西洋光缆时,它的传输率高达160万亿bps,增长了20多亿倍。全球数据增长的速度大约是每三年翻一番,也就是说,在过去三年里产生的数据总量,相当于之前人类产生数据量的总和。毫无疑问,在这样一个世界里,信息技术是科技发展的主旋律。
不过,能量和信息并非没有交集,航天技术就是这两条主线的交会点。20世纪,很多重大的发明都和战争有关,从雷达、核裂变到火箭技术,这说明战争具有推动科技进步的一面。很多发明虽然最初是用于军事目的,但是很快便开始用于民用,造福人类。直到今天,几乎所有的发明创造和技术进步带来的好处都远远大于危害。技术本身并没有善恶之分,它们产生的结果完全取决于人类如何使用它们。
人类从轴心时代开始,到工业革命之前,科技的进步大致是匀速的,但是工业革命之后,科技进步的速度明显加快,重要科技成果出现的密度越来越高。这个趋势在21世纪还会持续。工业革命之后,科技进步的另一个特点是,重大的发明和科学发现会有很多人几乎在同一时刻做出。因此,从人对科技的贡献来说,个别天才及偶然性因素的作用在相对变弱,而系统的作用、方法论的作用,包括资金甚至综合国力的作用则在提升。在未来,每个人都有通过掌握有效的科技创新方法发挥自己作用的可能性。
原文中无”半径”二字出现,此处距离即圆的半径。
这就是大家提到的欧几里得第五公设,即现行平面几何中的平行公理的原始等价命题
该书写作于1564年左右,但直到1663年才出版。
1-(5/6)4×100%=52%
他们是摩尔、罗伯茨(Sheldon Roberts)、克莱纳Eugene Kleiner,1923-2003)、诺伊斯、格里尼奇Victor Grinich,19242000布兰克(Julius Blank,1925-2011)、在尔尼(Jean Hoerni1924-1997)和拉斯特(Jay Last)。
WnTel是微软的 Window和英特尔公司(lnte)处理器的合称。
和李世石对弈的 AlphaG使用了1920个cPU和280个GPU(图形处理器)。当时每个CPU每秒可完成5000亿7000亿次浮点运算,每个GPU每秒可完成7万亿次运算。
这些处理器的计算能力相当于6000亿台埃尼亚克。6000亿台埃尼亚克的耗电量为90拍瓦(10的15次方瓦)而三峡的装机容量为21吉瓦。
后来人们发现,自由组合定律并非在任何时候都成立,它的成立是有条件的。
由于摩尔根这个单位太大,大家更多使用的是厘摩(centimorgan,即1%摩尔根)。1厘摩大约相当于100万个人类基因中的碱基对。
[1] 罗巴切夫斯基,库图佐夫。罗巴切夫斯基几何学及几何基础概要[M].哈尔滨:哈尔滨工业大学出版社,2012.
[2] V. A. Toponogov,Riemannian geometry,Encyclopedia of Mathematics,详见:http://mathworld.wolfram. com/RiemannianGeometry.html。
[3] 那一年,柯尔莫哥洛夫还发表了其他7篇论文,参见:Andrey Kolmogorov at the Mathematics Genealogy Project,链接:http://www-history.mcs.st-andrews.ac.uk/Biographies/Kolmogorov.html。
[4] Boole,George(1854). An Investigation of the Laws of Thought.Prometheus Books.2003 reprinted.
[5] Bertalanffy,L. von,Untersuchungen über die Gesetzlichkeit des Wachstums. I. Allgemeine Grundlagen der Theorie; mathematische und physiologische Gesetzlichkeiten des Wachstums bei Wassertieren. Arch.Entwicklungsmech.,131:613-652,1934.
[6] Norbert Wiener. Cybernetics: Or Control and Communication in the Animal and the Machine. Paris,(Hermann & Cie) & Camb. Mass. (MIT Press),1948.
[7] 参见拙作《文明之光》中所讲述的卡尔曼滤波和阿波罗火箭控制的关系。
[8] Rojas,Raúl,“The Zuse Computers”. Resurrection:the Bulletin of the Computer Conservation Society (37),2006.
[9] Claude Shannon,A Symbolic Analysis of Relay and Switching Circuits,Master Thesis,MIT,1937.
[10] . Turing,A.M..“On Computable Numbers,With an Application to the Entscheidungsproblem”,Proceedings of the London Mathematical Society,1936–7.
[11] . Stern,Nancy. From ENIAC to UNIVAC: An Appraisal of the EckertMauchly Computers. Digital Press,1981.
[12] . 全世界个人计算机销售量在2011年达到顶峰,随后5年逐年下降,到2016年已经累积下降27%。数据来源:statista.com,Five Years Past Peak PC,by Felix Richter,Jan 13,2017。
[13] . 数据来源:statista.com。
[14] . Magnuski,H. S.“About the SCR-300”. SCR300.org.
[15] . 数据来源:思科公司年度网络指数报告,参见:Cisco Visual Networking Index:Forecast and Methodology(2006–2016)。
[16] . McDougall,Walter A.The Heavens and the Earth: A Political History of the Space Age. New York: Basic Books,1985.
[17] . William J. Jorden.Soviet Fires Satellite into Space,New York Times,Oct 8,1957.档案复印件链接:http://movies2.nytimes.com/learning/general/onthisday/big/1004.html。
[18] . National Defense Education Act,美国参议院相关链接网址:https://www.senate.gov/artandhistory/history/minute/Sputnik_Spurs_Passage_of_National_Defense_Education_Act.htm。
[19] . 参见美国国家航空航天局(NASA)有关约翰·侯博尔特的纪念网页。https://www.nasa.gov/langley/hall-of-honor/john-c-houbolt。
[20] . Mendel,J. G.“Versuche über Pflanzenhybriden”,Verhandlungen des naturforschenden Vereines in Brünn,Bd. IV für das Jahr,1865,Abhandlungen: 3–47,1866.
[21] . Watson,J.D.; Crick,F.H..“A structure for deoxyribose nucleic acids”(PDF). Nature. 171 (4356): 737–738,1953.
[22] . Wilkins,M.H.F.; Stokes,A.R.; Wilson,H.R..“Molecular Structure of Deoxypentose Nucleic Acids”(PDF). Nature. 171 (4356): 738–740,1953.
[23] . Franklin,R.; Gosling,R.G.,“Molecular Configuration in Sodium Thymonucleate”(PDF). Nature. 171 (4356): 740–741,1953.
[24] . Total WW Data to Reach 163ZB by 2025,That's ten times the 16.1ZB of data generated in 2016.