二战结束之后仅一年(1946年)时间,世界第一台通用计算机,电子数值积分计算机“埃尼阿克”(Electronic Numerical Integrator And Computer,ENIAC)在美国宾夕法尼亚大学诞生,并实际应用于陆军火炮弹道和火力计算工作,这个事件标志了通用可编程的计算机技术不仅是理论已成熟,而且已经有了初步的工业化成果。
在两年之后(1948年),诺伯特·维纳(Norbert Wiener,1896-1964)和克劳德·香农(Claude Shannon,1916-2001)分别发表了两部极具开创性的著作,创立了“控制论”和“信息论”,再结合上之前路德维希·冯·贝塔朗菲(Ludwig Von Bertalanffy,1901-1972)在1945年发表的对“系统论”的总结性著作,整个信息科学仿佛被上帝的手推动着,后世称之为“信息学三论”的三门支柱性理论几乎于同一时刻问世,短短几年时间里面一下子就完成了过去需要几十年时间才可能完成的发展突破。
信息科学的研究,不论是理论上还是工程上,都从之前各个学者、机构零散研究摸索的状态一下子变得系统有序起来。
信息科学这门学科在20世纪40年代诞生以后,很快就取得了一系列令人瞩目的成就,这让从政府官员、科学家等精英到社会的底层群众都感受鼓舞,大家似乎已乐观地预见到了蒸汽机械代替人类的体力劳作的工业革命后,下一场由智能机械代替人类做脑力劳作的信息革命的到来。
从大半个世纪后的今天回望当初,我们确实在蒸汽动力革命、电力革命之后,见证了信息革命的来临,不过,即使有互联网这样超出了所有前人想象的技术出现,但在当时的大家看见的目标蓝图里,信息革命的最重要成果还不仅是大家现在能接触的电脑和网络,今天计算机可以根据人类预设的指令和程序,快速的传递、计算和处理人类无法想象的天量数据,而当时人们所期望的信息时代的新型机械,不仅能够完成计算和信息传输,甚至还将是一种能够和人类一样可看、可听、可写、可说、可动、可思考、可以复制自身甚至可以有意识的机械。
笔者所描绘的这个场景,不是来自于可以随意凭空想象的科幻小说,而是引述了当年刊登在《纽约时报》上,美国海军对“感知机Mark-1”(这台机器可以说是连接主义在工程实践上的开端,我们后面章节中还要提到它)的期望和评价:
The embryo of an electronic computer that (the Navy) expects will be able to walk, talk, see, write, reproduce itself and be conscious of its existence.
破解德军Enigma密码的Bombe
1942年末,图灵被英国政府秘密派到美国,和美国海军交流破译德国的北大西洋潜艇舰队密码的研究成果。结束在华盛顿交流后,图灵又来到了贝尔实验室,参与这里的安全语音通讯设备的研发工作。这样,当时正在贝尔实验室数学组供职的香农就获得了一个和图灵合作的机会。
图灵在当是破译了包括希特勒通话在内的多项德军秘密通讯的密码学破译专家,而香农当时的工作是通过数学方法证明“X系统”——这是美国总统罗斯福到英国首相丘吉尔之间的加密通讯系统,是不可能被他人所破译的,他们两位经过在密码学上“矛和盾”的攻防探讨,很快让图灵和香农成为了惺惺相惜的好友。
虽说图灵是去美国做交流的,但是军事上的事情,尤其是密码的加密和破解这种事情,只要不在军方明确允许的范围内,平常时间是不允许交流各自进展情况的,所以在密码学上的话题,他们工作之外无法随意讨论什么。所幸香农和图灵在计算机科学、信息科学上的兴趣和研究范围都极为广泛,经常饭堂闲聊就经常拉到其他各种的前沿领域上。
一次,他们在自助餐厅见面时,图灵给香农看了他还在剑桥大学念硕士时(1936年)写的一篇论文《论可计算数及其在判定性问题上的应用》(“On Computable Numbers, with an Application to the Entscheidungsproblem”),这篇文章是可计算性领域的里程碑式作品。
关于可计算理论可以追溯到1900年,当时著名的大数学家大卫·希尔伯特(David Hilbert,1962-1943)在世纪之交的数学家大会上给国际数学界提出了著名的“23个数学问题”。其中第10问题是这样的:
这个简单的机器对人类的“模仿游戏”便是现今举世闻名的图灵测试。图灵在提出图灵测试的时候,并未想到会对后世带来如此深远的影响。大概1998年互联网兴起开始,每隔一段时间就有企业或机构出来声称自己研制的机器人通过了图灵测试,其实这几乎都是商业操作和宣传的噱头,无一例外都是特定条件下,如“在5分钟或者20句的对话中,成功令若干个的受测者认为与他对话的机器是个13岁的孩子”这一类型的“通过测试”。
而图灵所定义的图灵测试,更接近于一个思想实验,并未规定参加测试的机器要和人对话多长时间,要骗过受测者中多少人,参加测试的人类智力、年龄等应该在什么样的水平,机器应该模仿一个年龄多大的人类等等(论文中倒是列举了很多可能提的问题和计算机回答的场景来进行论述,但并未对测试加以任何判定的条件限制)。图灵测试中所指的人类,也更多是一个泛称,而非特定的某类人或某个人类个体。
迄今为止,没有任何机器能够通过真正意义上的图灵测试。有趣的是,因为机器在图灵测试上一次又一次的失败,人类基于机器通过这种测试的困难度,反而创造出图灵测试最广泛的应用场景,这种应用在网络上随处可见——图形验证码。验证码的英文单词“Captchac”其实就是 “通过图灵测试来完全自动地分辨出计算机和人类”这句话的首字母缩写(Completely Automated Public Turing test to tell Computers and Humans Apart) 05 智能与人类的界限
今天主流的人工智能研究中,直接以创造出能通过图灵测试的人造智能机械为目标的研究项目其实极为罕见的,这一方面原因是因为图灵测试的难度实在是太高,难以出成果;还有另一方面的原因是图灵测试所提出的目标,其实是已经超过了人类自身的需要了,好比人类要不断制造更好飞机的目的肯定是为了更快更舒适的旅行,而不是为了它飞的更像鸽子以至于能欺骗掉其他鸟类。
通过一个简单的集合关系,可以令我们以更严谨的方式来理解“人类所需的智能”和“能够模仿人类通过图灵测试的智能”这两个问题的差别。如图所示,我们定义了两个集合:“全部智能行为”和“全部人类行为”,以及两者的交集“属于人类需要范畴的智能行为”,并以此举例: