王小川断言AlphaGo将完胜李世石他会被打脸吗？

本文作者：金红

2016-02-05 10:47

导语：前不久还在极客公园论坛上表示人工智能在今天与人脑有很大距离，甚至不如一个1岁小孩，这次在面对人工智能与专业棋手对弈的时候，却直接断言赢得一方一定会是AI。

上周，谷歌AI在围棋上以5比0战胜了欧洲冠军樊麾的消息引起极大关注。而更为大家津津乐道的，是谷歌还向韩国围棋九段高手李世石公开发起挑战，要在下个月进行AI与围棋高手的较量。作为围棋界最高水平的代表，如果李世石输了，代表的是人类输了。

谷歌使用的人工智能软件是AlphaGo，由谷歌去年收购的人工智能公司DeepMind研发。关于AlphaGo与李世石之间的这场较量，外界有着不同的看法，但总体而言，觉得赢得可能性低的人会更多些，因为樊麾仅为二段棋手，二段棋手与九段棋手之间，差得可不是一星半点。

虽然AlphaGo与李世石的对弈还有差不多两个月时间，但关于其输赢的讨论在持续发酵中，有专业棋手从下棋手法上进行分析，有人工智能专业者从科技角度，也有像搜狗CEO王小川这样的技术大咖忍不住参与讨论。

作为技术热衷者，王小川对于人工智能的发展一直都比较关注，不过，前不久还在极客公园论坛上发表演讲表示人工智能在今天与人脑有很大距离，甚至不如一个1岁小孩儿，这次在面对人工智能与专业棋手对弈的时候，却直接断言赢得一方一定会是人工智能。这，又是为什么？

王小川断言AlphaGo将完胜李世石他会被打脸吗？

王小川知乎全文：

AlphaGo的发布，是一个伟大的里程碑，又一次让我兴奋地需要说一说。

先说我的断言一：AlphaGo在两个月后，将会完胜李世石。

留个关子，本文最后再说断言二。

从中学开始，我就着迷用算法来解决游戏的博弈问题，用搜索方法创新性完成过一些题目。这几年深度学习出现后，就感觉有机会能够突破围棋，和清华的联合实验室做过几次探讨，都认为这个方向可行，可惜限于气场和能力不足，没能组织进行这方面的投入。

而此次出手的，是Google旗下的DeepMind团队，在深度学习方面是最顶尖的，资源、能力、气场都没有问题，突破性的技术是基于深度学习进行估值和走棋。

看知乎里好多讨论，是从之前AlphaGo完成的棋局来判断其下棋风格，倒推这个算法的威力，有点刻舟求剑的感觉。我们核心还是要回到对这次AlphaGo用到的技术的深刻理解。为了便于讨论，我们对比以搜索剪枝为核心的深蓝下国际象棋，和以搜索剪枝+深度学习为核心的AlphaGo的三个区别：

1. 围棋相对象棋，最大的区别是棋局的评价函数极难定义。象棋可以找到各种“特征”来计分，比如丢一个马扣多少分，兵往前拱到离底线近了加多少分，而围棋做不到，密密麻麻的黑白子挨着，互相之前又有关联，变化多，规律难以总结。这也是传统算法相对人最弱的几个问题之一。就像是我们人做人脸识别，看一眼就知道是张三李四，而机器算法难以下手。这个问题恰恰是最近几年深度学习最大的突破之处，深度学习不需要人来设计算法“找特征”，通过大量原始数据和标签的对于，机器就能够自动找特征，并且并不比人差。在几年前还有很多人认为机器在图像处理方面举步维艰，怎么定义和抽象鼻子？耳朵？眼睛？可就在这一两年深度学习突飞猛进，一举超过了人类。就在2015年，人脸识别方面，机器的识别能力已经超过了人了，这可是人进化了数千万年的核心能力之一呀。一个围棋棋局，可以理解为一张19*19的图片，其他的走棋规则和非常简单（很容易翻译成计算机规则），正好落入了深度学习擅长的事情。搜索+深度学习，这个算法完全可以覆盖围棋的规则，人下棋的思维过程和模式，只是AlphaGo的一个子集。这就决定了这个算法没有天花板，有机会在围棋领域“打通关”。

2. 深蓝相对AlphaGo，AlphaGo最大的优势是“学习能力”。深蓝的开局更多依靠数据库棋谱的建立，但没有泛化能力（不懂得举一反三），对于没有见过的走棋方法就可能犯傻。而之后的核心能力是计算力，通过暴力的搜索（当然也有最优秀的剪枝，但还是暴力），力图走出10-20步棋来选择最优的路径。这个复杂度是指数级的，变成一个NP问题，受限于计算力。这个系统的算法是写死的，固定的参数下，就会有固定的表现。而调整参数和改变算法，都是工程师的事情。这个系统的天花板是计算机有多强，以及工程师有多聪明。而AlphaGo更多是数据驱动的，喂给他更多的棋局数据，他就能够优化“神经元网络”，同样的运算资源下变得更聪明，并且具有举一反三的能力，这一点非常接近于人（或者说本身就是模拟人的方式来设计的）。而且我们知道，机器处理数据的能力足够地快，以及没有情绪不会出错，这就决定了这个系统如果把今天互联网上能收集到的棋局都学一遍，就成为顶尖高手了。

3. 最最最可怕的还不只是前面这两点，对于下棋博弈问题，AlphaGo还不只是从互联网上去收集数据进行学习，更可以自己和自己下，实现“自学习”。看过电影“超验骇客”没有？人工智能可以做到随着时间的推移就能更加聪明。金庸小说中老顽童让自己左手和右手打架“左右互搏”，成为天下无敌的武功，那个只是故事，在下棋这个领域，而AlphaGo有这样的设计，让这种武功成真了！往下还有两个月的时间，AlphaGo这样一台算法上没有天花板的机器，很有机会在“左右互搏”下登峰造极，成为不可超越的围棋高手。

AlphaGo的技术问题讲完了。怎么来看Google背后的完整动作呢？有人觉得是过度解读了，实际系统挺糙的 -- 选的都是“欧洲冠军” -- 说明系统并不行，这是一种错误的理解。更有可能的原因是Google和Facebook在竞争下围棋，Facebook的员工缺心眼提前放了好多消息出来泄密了，结果Google就赶紧把Nature的文章发了抢了个先，然后卖个期货两个月后和人类对决，那会儿系统就足够好了，这是在竞争环境下合适的做法。

事实上Google和Facebook两家都认识到了AI的重要性，以及就在最近几年会有大的突破。Google 4亿美金收购了DeepMind，当时只有20人，现在已经突破200人了，并且是不计代价的疯狂投入。下围棋只是体现人工智能进步绝佳的宣传点和切入点，从公开的文献可以看到，DeepMind做围棋研发是基于通用的技术进行，领域无关的（Domain independent）。这样的技术未来可以用到合适的其他领域里去。深度学习的魅力在于，只要一个领域里能够建模，能够有充足的数据，就能够在这个领域里做到超越人、取代人，短时间能从0分做到99分。如果我们依然是老观念，用渐进的方式来理解机器智能，比如之前某位大佬宣传他家的XX大脑做到了X岁的智力，这是很误(che)导(dan)的。我们同样也会错误地估计下围棋方面机器的能力，按照人类的理解1D-9D来评价它。一句话，不要用评价人的方法来评价机器的人工智能的能力，完全是不同的模式。

老罗曾经评价过人工智能的一句话：“人工智能就像一列火车，它临近时你听到了轰隆隆的声音，你在不断期待着它的到来。他终于到了，一闪而过，随后便远远地把你抛在身后”。

如果给这句话打上一个补丁，把人工智能的应用局限到一个一个的具体的封闭领域，这是一个很贴切的描述。我们不要过度自大，例如我们容易在自我优越感的驱使下，说动物不如人，比如人会直立行走、会说话、会实用工具，以区别于其他动物。事实证明，动物也会。面对机器也一样，就在几个月前还有人叫嚣机器十年内不能够玩转围棋，理由也都是人一眼就能看明白，机器只会计算。这些自大会让我们误判。也不用过于自卑，觉得围棋上机器上胜利了人类整个智力就被碾压了，到今天机器还是有很多领域完全无能，只能在局部领域。

到结尾，再说断言二：除了围棋，人工智能在其他博弈类的封闭游戏里，也会横扫一切，完胜人类。

虽然王小川的论点过于武断，不过AlphaGo赢的可能性其实也并不低，它的真实围棋水平可能远远不止现在所呈现的。首先，AlphaGo与樊麾的对弈其实发生在去年10月，只不过最近才被曝光，在这之后的几个月中，AlphaGo有多大的提高，我们不得而知。其次，此事被报道后，在高手云集的弈城围棋网上，出现了疑似AlphaGo的身影，而且从它的对战数量和战绩上看，它已经和人类进行了大量的交手。甚至，最好的成绩达到过9D（段）。由此可见，AlphaGo一直在掩盖其锋芒，就像王小川所言，谷歌选择在这个时候让AlphaGo挑战李世石，一定是建立在足够的自信上的。

当然，AlphaGo是否能在下个月底的比赛中赢得胜利，现在来说都为时过早。不过，这绝对不会是一场压倒性的比赛，而是高手与高手之间的巅峰对决。

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

0人收藏