第二章 大数据和机器智能
在有大数据之前,计算机并不擅长于解决需要人类智能的问题,但是今天这些问题换个思路就可以解决了,其核心就是变智能问题为数据问题。由此,全世界开始了新的一轮技术革命智能革命。
当我们有可能获得大量的、具有代表性的数据之后,能够获得什么好处呢?大家很快就想到把一些模型描述得更准确,或者对一些规律认识得更深刻。比如当开普勒从他的老师手上接过大量的天文数据之后,他终于找到了准确描述行星围绕太阳运动轨迹的模型——椭圆模型。类似的情况在今天不断地发生。但是,这还远远不足以让我们兴奋,因为那还只是一个量的改变,不足以产生颠覆这个世界的创新。
大量数据的使用,最大的意义在于它能让计算机完成一些过去只有人类才能做到的事情,这最终将带来一场智能革命。我们不妨用一些具体的例子来说明这种趋势。
在过去,只有人类才有用语音交流的能力,尽管人类从1946年开始就努力让计算机有听得懂人的语音的智能,但是一直不成功。20世纪70年代,科学家们采用数据驱动方法,找到了解决这个问题的途径,并且不断地改进方法。但是语音识别准确率的提高,主要是靠20世纪90年代以后数据的大量积累。从这个研究领域,大家开始看到了数据的重要性。类似地,图像识别也取得了根本性的突破。
在2000年以后,由于互联网特别是后来移动互联网的出现,数据量不仅剧增,而且开始相互关联,出现了大数据的概念。科学家和工程师们发现,采用大数据的方法能够使计算机的智能水平产生飞跃,这样在很多领域计算机将获得比人类智能更高的智能。可以说我们正在经历一场由大数据带来的技术革命,其最典型的特征就是计算机智能水平的提高,因此我们不妨把这场革命称为智能革命。当计算机的智能水平赶上甚至超过人类时,我们的社会就要发生天翻地覆的变化,这才是大数据的可怕之处。
那么为什么大数据会最终导致这样的结果,大数据和机器智能是什么关系呢?要说清楚这一点,首先要说明什么是机器智能。