2
【编者按】在人工智能领域,联接主义和符号主义的思想和方法在各自的领域都取得了巨大成功。但是,机械学习的方法能否抽象出因果规律,机械定理证明方法能否发展出真正的概念定理体系,这些都还是极具争议的问题。
人工智能领域的主要思想流派大致可以分为符号主义和联接主义。两种方法具有完全不同的哲学观点、计算方法和适用范围。两者都有着令人叹为观止的壮丽恢弘,但也都有着自身难以打破的魔咒。
联接主义与深度学习
联接主义(Connectionism)又称为仿生学派(Bionicsism)或生理学派(Physiologism),其主要原理为神经网络及神经网络间的连接机制与学习算法(Artifical Neural Nework),实质上是来自于人类大脑神经网络的计算机模拟:大脑的每个神经元细胞具有树突、轴突和细胞体。树突可以接收信号,轴突用于输出信号,不同细胞的树突和轴突之间是神经突触,不同的突触具有不同的权重。树突传入的信号强度与相应的突触权重相乘,经由细胞体设置的非线性阈值检验,触发轴突的兴奋或抑制。数目庞大的神经元连接成结构复杂的网络,从而实现灵活多样的功能。
在并不久远的历史中,神经网络几经沉浮,沧海桑田。在学术界和工程界,数度一哄而上,旋即一哄而散。近些年来,依随计算能力的突飞猛进,特别是图形处理单元(GPU)的大规模普及,使神经网络再度以深度学习(Deep Learning)的崭新姿态登场。
深度学习在图像处理、模式识别等领域如狂飙突进, 一扫几乎所有经典算法,势不可挡。一夜之间,自然语音的处理和理解、人脸检测和识别都变成了现实。同时,深度学习方法深刻地转变了学术研究的范式。以前学者们所采用的观察现象、提炼规律、数学建模、模拟解析、实验检验、修正模型的研究套路被彻底颠覆,被数据科学的方法所取代:收集数据,训练网络,实验检验,加强训练。
深度学习方法具有许多其它方法无可比拟的优点:
首先,深度学习的算法具有普适性。
同样的训练方法可以用于不同的具体应用,例如人脸检测和语音识别都可以应用同样的训练方法,区别只在于训练数据的不同。这一点具有神经生物学的依据:MIT的科学家将幼年猴子的视神经和听神经剪断,互换后再连接,猴子的视觉和听觉都得以正常发育。相对于传统方法,对于拓扑问题和几何问题,我们需要应用完全不同的理论和计算工具。
其次,机器学习的算法本身相对简单,算法所涉及的数学理论相对初等,实现复制的难度相对较低。
目前流行的观点认为,对于机器学习而言,算法的优越性不再重要,真正决定性的要素是数据的庞大和完全。更为深刻之处则在于:深度学习能够自动形成不同层次的概念。深度学习网络一如人类的视觉中枢是具有层次的,局部的具体特征,被底层网络所总结;全局的抽象特征,被高层网络所提取。并且,这些特征被网络以权重的形式所储存。传统方法所无法明晰表述的概念,例如不同画家的艺术风格、音乐特色等只可意会无法言传的感觉在现在可以被精确量化,并以数字的形式被识别、处理、转换和融合。人工智能的本质特征之一就是系统能够自发地形成概念。当然,深度学习方法更是具有无可比拟的实用价值,人脸识别、语音识别方面的突破也为工业商业的发展提供了难以想象的广阔空间。
但与此同时,机器学习的方法也具有方法论上的巨大缺陷:
首先,深度学习的目的是学习一个函数,或者概率分布,本质上是唯像的解释,换言之,这种方法揭示了“相关性”而非“因果性”。历史上,人类积累科学知识,在初期总是得到“经验公式”,但是最终还是在寻求更为深刻的本质的理解,例如从炼丹术到化学、量子力学的发展历程。
其次,目前机器学习算法的空间和时间代价过大。比如我们考察人脸表情识别问题,人脸上只有几十条肌肉,加上光源变化、视角变化等等因素,所有人脸带表情的照片所形成的空间(流形)不会超过上百维。但是,所训练的神经网络往往具有数十万维。训练数据量巨大,训练周期过长。
再次,目前深度学习方法的理论相对比较薄弱,算法经验性较强。参数的调节方法目前依然是一门“艺术”,而非“工艺”,算法最终收敛到局部最优。如果将机器学习算法视作蒙特卡洛方法(也称统计模拟方法,是指使用随机数或伪随机数来解决计算问题,与之对应的是确定性算法),那么理论上它的收敛速度是低于传统方法的。深度学习方法在视觉领域无可争议地取得了令人瞩目的成功,但是动物的视觉可能比人类更为敏锐和灵活,人类智能最为独特之处在于数学推理,特别是机械定理证明,对于这一点机器学习方法是无能为力的。为此,我们必须借助于符号主义方法。
符号主义与机械定理证明
符号主义(Symbolicism),又称为逻辑主义(Logicism)、心理学派(Psychologism)或计算机学派(Computerism),其原理主要为物理符号系统(即符号操作系统)假设和有限合理性原理。
符号主义方法模仿数理科学的发展方式,将知识系统地整理成公理体系。这种方法将数学严格公理化,从公理出发,由逻辑推理得到引理,定理,推论。广义而言,将数学发现整理成一系列的逻辑代数运算,将直觉洞察替代为机械运算。在初等几何领域,机械定理证明方法取得了巨大的成功。例如利用吴文俊方法和Groebner基方法推演出几乎所有经典欧式几何的定理:将输入图形的关键点建立坐标,各种已知的几何条件表示成代数方程(一般表示成关键点坐标的多项式方程),同样将结论的几何条件转化为多项式方程。那么证明定理即等价于验证结论多项式在由条件多项式生成的理想之中。
和机械学习方法类似,这种机械定理证明方法将千奇百怪的几何定理证明方法都转化为一种方法,因而具有极大的普适性;同时,机械定理证明可以保证推导过程中出现错误的概率极小。人们一度相信,在计算机的巨大帮助下,许多深刻的定理证明将会轻易获得。
但是,这种机械定理证明的方法也存在巨大的争议:
首先,公理化方法具有本质的局限性。
哥德尔的工作证明了对于任何一个公理体系,总是存在一个客观真理,不被此公理体系所包含。这在某种意义上意味着人类探索自然真理的过程是无限的。对于任何一个包含算术公理体系的公理体系,总存在一个命题,它无论对错都和公理体系不发生矛盾。比如我们知道有理数有无穷多个,实数有无穷多个;有理数可以和实数的一个子集建立双射,实数无法和有理数的子集建立双射,从这个意义上而言,有理数严格少于实数。那么,是否存在一个无穷数集,它的个数严格介于有理数和实数之间(在如上的意义下)。这个问题的答案无论是有或无,对于现代数学公理体系都不发生矛盾。
其次,机械定理证明方法在根本上是“证明”了定理,还是“检验”了定理?
在数学历史上,对于一个著名猜想的证明和解答,答案本身并不重要,在寻找证明的过程中所凝练的概念、提出的方法、发展的理论才是真正目的所在。机械定理证明验证了命题的真伪,但是无法明确地提出新的概念和方法,实质上背离了数学的真正目的。比如地图四色定理证明,数学家将平面图的构型分成1936种,然后用计算机逐一验证,在这一过程中,没有新颖概念的提出。换言之,用机械蛮力替代了几何直觉。
再次,机械定理证明的前提是问题的代数化。
初等几何问题必须经过坐标化,条件和结论的代数化之后,才能运用理想理论来机械证明。但是,几何问题代数化本身可能就是最为“智能”的步骤。比如大量黎曼几何和低维拓扑中的命题无法被直接代数化。另外一点则在于算法的复杂度,希尔伯特定理是说多元多项式环中的理想都是有限生成的,这一定理保证了 Grober 基方法在有限步骤内停止,但是这一算法在计算过程中所消耗的空间有可能是超指数膨胀,因此在现实中,对于复杂的定理,这一算法无法胜任。
另外一点,机械定理证明给出的结果人类经常无法理解,从中无法直接得到启迪。
迄今为止,机械定理证明方法尚未发现具有重大意义的人类未曾知道的定理。
“人何以为人”才是问题的本质
在实际应用中,联接主义和符号主义的方法是相互融合、取长补短的。
比如,棋类比赛本质上是一个公理系统,属于符号计算的范畴,传统上可以用逻辑推理加上空间搜索技术加以解决。由于搜索空间的指数膨胀,如何剪枝(简单的说就是把不合适的情况直接去掉)成为关键。剪枝依赖于记忆并识别一些有意义的模式,这些模式可以用深度学习的方法来获取(目前这一研究已经由帝国理工学院的马修-莱团队实现,并获得成功)。而对于空间复杂度更高的围棋,人工智能依然无法战胜人类。我们相信,这一局面也很快会被打破。
人工智能的方法日新月异,日益侵占着人类智能的领地。联接主义和符号主义的思想和方法相辅相成,各有千秋,它们在各自的领域都无可争议地取得了巨大成功。但是,机械学习的方法能否抽象出因果规律,机械定理证明方法能否发展出真正的概念定理体系,这些都是具有激烈争议的问题。联接主义和符号主义所面临的魔咒都指向同一个根本问题:机械蛮力和人类智能的本质差异究竟在哪里,人之所以为人的本质在哪里。
【作者顾险峰,哈佛大学计算机科学博士,现任纽约州立大学石溪分校计算机系终身教授、清华大学丘成桐数学科学中心客座教授。顾险峰博士与丘成桐先生,以及国际著名数学家、计算机科学家共同创立了一门横跨数学和计算机科学的交叉学科:计算共形几何,应用现代几何理论于工程和医疗领域,特别是曲面参数化,曲面注册,人脸识别,形状分析,医学图像等等。顾险峰为此获得了2013年世界华人数学家大会最高奖-晨兴应用数学金奖。】
雷峰网原创文章,未经授权禁止转载。详情见转载须知。