- 读书 >
- 全球科技通史 - 吴军 >
- 第四篇 现代科技 >
- 第九章 信息时代
新数学和新方法论
18世纪之后,技术的发展已经离不开科学,而科学的发展则需要更基础的研究工具,那就是数学和方法论。到了20世纪,虽然不再有阿基米德、牛顿和高斯这样的大数学家出现,也不再有欧氏几何学、笛卡儿解析几何和牛顿–莱布尼茨微积分那样众所周知的新的数学分支诞生,但是数学还是在飞速发展,数学和基础科学的关系比过去更加紧密。为了适应新的科技发展,数学在20世纪产生了一些新的分支,同时一些过去处于数学王国边缘的分支也开始占据中心位置,其中非常值得一提的是概率论和统计、离散数学、新的微积分和几何学,以及数论等。今天的数学完全基于公理化体系,这一点虽然让普通人难以理解数学的成果,却让数学变得比以前更加严密。因此,在介绍20世纪科学的具体成就之前,我们必须花一些篇幅回顾一下近代以来很多数学分支完成体系化和公理化的过程。
数学和自然科学不同,虽然数学会受到一些实验和观察现象的启发,但是它并不是在假说之上,靠实验来证实或者证伪建立起来的庞大的知识体系。数学完全是靠逻辑推导,从简单的定义和很少不证自明的公理上演绎出来的。因此,数学和数学的分支在诞生之初未必能有极为严密、无法辩驳的逻辑,仍需要后世的数学家不断补充完善,完成严密公理化的过程。
在古代,这方面最好的例子是我们前面提及的,欧几里得在总结东西方历史上几个世纪积累的几何学成就的基础上,建立了公理化的几何学。同样,从19世纪到20世纪初,柯西、黎曼、勒贝格等人,在牛顿和莱布尼茨等人的基础上不断完善微积分的公理化。
柯西是法国历史上最优秀的数学家之一,当然也可能没有“之一”。他出生在法国大革命爆发的1789年,不过他并没有因此成为革命者,而是成了一个保皇派,因此,他也被后人戏称为正统的数学家和科学家。柯西的父亲是一位大律师,因此,他从小就受到良好的逻辑训练。在柯西父亲的好友中,有两位大数学家——拉普拉斯(Pierre Simon Laplace,1749—1827)和拉格朗日,他们把柯西带入了数学王国。不过,在柯西小的时候,拉格朗日给柯西父亲的建议是让他多学习文学。可能是出于这个原因,柯西后来成了历史上论文和著作最多、逻辑最为严谨的数学家之一。
柯西之前,微积分已经出现了100多年,并发展成为数学的一个庞大分支,应用也非常广泛。但是,微积分有一个先天的缺陷,即理论基础并不牢固。事实上,早在牛顿的时代,哲学家贝克莱(George Berkeley,1685—1753)就和牛顿在“无穷小量”是否为“0”的问题上发生了争执,对此,牛顿也没有很好的解释方法。柯西在数学上的最大贡献是在微积分中引入了极限概念,以运动的眼光看待无穷小量,并以极限为基础建立了逻辑清晰的微积分。在柯西之前,包括牛顿和贝克莱在内都把无穷小看成一个固定的数。柯西的极限概念,是微积分的精华所在。在柯西工作的基础上,经过19世纪德国数学家魏尔斯特拉斯(Karl Weierstrass,1815—1897)、黎曼和法国数学家勒贝格的补充,微积分才成为数学一个极为严密的分支。
在数学界,既然一切定理和结论都是定义和少数公理(或者公设)自然演绎的结果,那么,如果公理错了怎么办?答案是很麻烦,一方面,数学某个分支的大厦会轰然倒塌,但另一方面,却能使数学得到进一步的发展。几何学的发展,便是如此。
我们知道欧氏几何学的大厦离不开它的5条公设:
·由任意一点到另外任意一点可以画直线。
·一条有限直线可以继续延长。
·以任意点为心及任意的距离可以画圆。
·凡直角都彼此相等。
同平面内一条直线和另外两条直线相交,若在某一侧的两个内角的和小于二直角的和,则这二直线经无限延长后在这一侧相交。前4条大家都没有异议,对于第五条(等同于“过直线之外一点有唯一的一条直线和已知直线平行”),一般人在学习几何学时都没有怀疑过,因为它和我们的常识一致。但是,如果过直线外的一点能做出来不止一条平行线怎么办?一条平行线也做不出来又怎么办?如果是这样,欧氏几何的大厦就塌了。
19世纪初,俄罗斯数学家罗巴切夫斯基(Nikolai Lobachevsky,1792—1856)就假定能做出不止一条平行线,从而推演出另一套几何学体系,被称为罗氏几何。19世纪中期,德国著名数学家黎曼又提出了新的假设,即过直线外的一点,一条平行线也做不出来,从而又推演出了一套新的几何学体系,被称为黎曼几何。
面对三套相互矛盾但又各自非常严密的几何学体系,数学家很快发现这三种几何都是正确的,只是它们一开始的假设不同。至于应该用哪一套几何学,则要看用在什么场合。在我们的日常生活中,即一个不大不小、不远不近的空间里,欧氏几何是最适用的;但是,要研究像珊瑚表面那种形状的二维空间,罗氏几何更符合客观实际;而在地球表面研究航海、航空等实际问题时,黎曼几何显然更为准确。事实上,爱因斯坦广义相对论所使用的数学工具就是黎曼几何,它也是今天理论物理学重要的工具“微分几何”(differential geometry)的基础。在宇宙中,由于存在物质引力场,我们生活的空间实际上是黎曼所描述的那种弯曲了的空间,理想状态中的欧氏空间并不存在。
柯西、黎曼等数学家的工作表明,数学内在的逻辑性比它们的假设前提更重要,而具有坚实基础的数学分支必须是一个自洽的公理化体系。
进入20世纪后,数学的严密性比牛顿时代更强了,其中非常值得一提的有4项重大成就:
·从黎曼几何发展起来的微分几何。它是今天理论物理学和很多科学的工具。
·公理化的概率论和与之相关的数理统计。它是后来信息论和人工智能技术的基础。
·离散数学。它是计算机科学的基础。
·现代数论。它是今天密码学、网络安全和区块链的基础。
这里我们仅以概率论和离散数学为例,说明从近代到现代数学发展的规律和特点。
概率论(probability theory)的历史其实很悠久,16世纪,意大利文艺复兴时期百科全书式的学者,也是赌徒的卡尔达诺(Girolamo Cardano,1501—1576)在其著作《论赌博游戏》中就给出了一些概率论的基本概念和定理。
到了17世纪,法国宫廷开始玩一种掷色子的游戏,连续掷4次色子,如果有一次出现6点,就是庄家赢,否则是玩家赢。大家为了赢钱,就去请教数学家费马(Pierre de Fermat,1607—1665),费马用概率的方法算出庄家略占上风,赢面是52%。这是概率论和数学相关的第一次记载。
不过,直到18世纪都没有像样的概率理论,大家对概率通常也算不清楚,以至在发行彩票时,对特定组合该如何支付完全凭经验,这让数学基础非常好的大思想家伏尔泰找到了法国发行彩票的漏洞,从中挣了一辈子也花不完的钱。
从17世纪到19世纪,包括贝努里、拉普拉斯、高斯在内的很多数学家都研究过概率论,但直到19世纪末,它依然是支离破碎的不完备的理论,主流的数学家甚至不觉得概率论能算数学,而把它看成是一种经验理论。概率论能有今天的崇高地位,则要感谢俄国数学家柯尔莫哥洛夫。
柯尔莫哥洛夫和牛顿、高斯、欧拉等人一样,是历史上少有的全能型数学家,而且同样是少年得志。柯尔莫哥洛夫在22岁的时候(1925)就发表了概率论领域的第一篇论文,30岁时出版了《概率论基础》一书,将概率论建立在严格的公理基础上,这标志着概率论成了一个严格的数学分支。1931年,柯尔莫哥洛夫发表了在统计学和随机过程方面具有划时代意义的论文《概率论中的分析方法》,它奠定了马尔可夫过程(Markov process)的理论基础。从此,马尔可夫过程成为后来信息论、人工智能和机器学习强有力的科学工具。没有柯尔莫哥洛夫奠定的数学基础,今天的人工智能就缺乏理论依据。
柯尔莫哥洛夫一生在数学上的贡献极多,甚至在理论物理和计算机算法领域也有相当高的成就,他的成果如果要列出来,一张纸都写不下。因此,今天很多数学家把柯尔莫哥洛夫誉为20世纪数学第一人,并非过誉。
事实上,计算机科学的基础也是数学,但是计算机使用的数学和过去有很大的不同,因为在本质上计算机所处理的都是离散的而不是连续变化的数值,比如整数、集合、图、二元逻辑等。对象不同,工具也就不同,这些数学分支因为都是处理离散的结构及其相互关系,被统称为离散数学(discrete mathematics),包括数理逻辑、抽象代数、集合论和组合数学等。当然,也有人将与密码学息息相关的数论归到离散数学中。
数理逻辑的核心是布尔代数(Boolean algebra),它是利用二进制实现计算机运算的数学基础,因最早由19世纪英国一个叫乔治·布尔(George Boole,1815—1864)的中学数学老师提出而得名。虽然今天人们认可布尔是一位响当当的数学家,但是在他生前没有人这样认为。布尔的研究工作完全是出于个人兴趣,他喜欢阅读数学论著,思考数学问题。1854年,布尔完成了在近代数学史上颇有影响力的著作《思维规律》。在书中,他第一次向人们展示了如何用数学方法解决逻辑问题,将两个最古老的学科联系在一起。依靠布尔代数,计算机才能用二进制实现所有的运算。
抽象代数(abstract algebra)也被称为近世代数(modern algebra),后者是20世纪初发明这个数学分支的学者对它的称呼,前者则是从含义上对它做出了解释。19世纪末20世纪初,数学研究的趋势是要求越来越严谨,数学家的注意力转移到了一般性的抽象理论上,而不再满足于解决具体问题。在这样的环境下,伽罗瓦(Évariste Galois,1811—1832)、希尔伯特(David Hilbert,1862—1943)等数学家抛开代数中的具体问题,发明了一套基于简单定义和公理来研究代数结构的方法,形成了一个数学分支。
类似地,19世纪中期,数学家开始研究抽象的数与函数的关系。他们把一个个抽象的、能够描述清楚或者描述不清楚的对象放到一个大盒子中,这就是集合;又把这些对象之间抽象的关系和运算,用集合的函数来描述,这就形成了早期的集合论。但是和早期的概率论一样,早期的集合论并不严谨。到了20世纪初,德国数学家泽梅洛(Ernst Zermelo,1871—1953)和弗兰克尔( Abraham Fraenkel,1891—1965,后来移民到以色列)将集合论公理化,把它变成了数学的一个分支。
数学家早期并不知道这些工具有什么用途,只是觉得这样能够把数学变得纯粹而完美。这批数学家大多一生清贫,但是对抽象的概念和逻辑有着极大的兴趣,他们几十年如一日,演绎出精妙的数学体系。后来,这些理论成为今天计算机科学的理论基础。
当然,科学技术的工具远不止数学一种,很多新的方法论对科技进步的影响也是巨大的。在这方面,影响力最大的是被称为“三论”的系统论、控制论和信息论。
系统论研究的是复杂系统内部的关系。随着现代科技的发展,人类面对的系统越来越复杂,这些系统既包括人和生物本身,也包括物理学、经济学和社会学等学科的研究对象。进入20世纪后,人们发现过去的机械思维不再适用于研究一个复杂系统的整体特性,因为在一个复杂的系统中(比如人体),整体并不等于部分之和,将一个个部分分开研究,最后得不出整体的特性。20世纪30年代,奥地利学者贝塔朗菲(Ludwig von Bertalanffy,1901—1972)等人发表了一些以生物系统为研究对象的系统论论文。但是很快,第二次世界大战爆发,对系统论的研究被迫中断,直到二战后,完整的系统论观点才被提出来。系统论强调复杂系统的本质属性,认为它不可能是内部各部分属性简单的叠加,而是必须考虑各部分之间的关联性和统一性,才能从根本上认识整个系统。
系统论在二战中有一个非常好的应用,就是美国的原子弹计划,即曼哈顿计划。计划的负责人格罗夫斯和奥本海默应用了系统工程的思路和方法,大大缩短了研制的时间和成本。而这项工程的成功,也成为第二次世界大战之后系统论被认可的原因之一。
控制论是由天才科学家诺伯特·维纳(Norbert Wiener,1894—1964)于1948年正式提出的,但是他的很多想法在二战时期,甚至更早在中国清华大学做访问教授时就形成了。此外,苏联伟大的数学家柯尔莫哥洛夫几乎在同时提出了和维纳相似的想法,而与控制论有关的理论可以一直追溯到18世纪拉普拉斯的时代。不过,控制论成为一门完整的理论则要归功于维纳的贡献——此前不过是知识点,而此后则是一个完整的知识体系。简单地讲,控制论研究的是在一个动态系统中,如何在很多内在和外在的不确定因素下,保持平衡状态的方法。它的思想核心是如何利用对各种输入信号的反馈来控制系统。控制论在科技上有很多直接的应用,我们在后面会讲到它在阿波罗登月计划中所发挥的巨大作用。此外,它在管理学和经济学上的用途也不亚于在工程上的用途。
信息论是关于信息处理和通信的理论,由另一位天才科学家香农在第二次世界大战时提出,并在战后发表。香农采用了物理学中“熵”的概念,把虚无缥缈的信息进行了量化,从此人类可以准确地度量信息的多少,并且从理论上解决了数据压缩存储和传输的效率问题。信息论也是今天密码学和大数据的理论基础。
和控制论一样,信息论也是一种新的方法论,它否认了机械论把一切看成是确定性的思维方式,认为无论是一个系统还是传输的信道,都有不确定性,都有干扰,而消除这些不确定性所需要的正是信息。
以微积分为代表的高等数学和随后以机械和电为核心的工业革命紧密相连,而20世纪初确立的抽象的、完全公理化的新的数学体系(特别是离散数学)为后来的信息革命提供了数学基础。可以说,整个20世纪科技的发展离不开新的数学工具,只是它们常常在幕后默默地起作用,不为人关注。在方法论方面,如果说机械论代表了工业时代的方法论,那么“三论”则代表了信息时代的方法论,它们都出现在二战期间,和计算机的发明时间契合。这并非巧合,而是科技发展的必然结果。
在人类进入20世纪之前,人类的智力是能够处理身边所接触到的信息的。但是由于通信的发展、无线电的出现、雷达和信号检测技术的产生,信息的产生和传播的速度剧增,信息传播的手段也越来越多。人类开始进入信息时代,而存储和处理大量的信息需要新的工具,电子计算机遂应运而生。