关于机器学习，你所知道的，可能都是错的

本文作者：大壮旅

2018-06-25 18:53

导语：机器学习还有其他能耐吗？它们还能助力什么技术？又能发现什么新机遇？

雷锋网按，虽然机器学习已经成为一个高频名词，但是对于大众而言，它依然是一个遥不可及乃至模糊不清的概念。为此，著名投资人 Benedict Evans 在自己的博客上发表博文，针对这一问题表达了自己的看法；雷锋网对这篇博文进行了不改变原意的编译。

机器学习的风潮已经刮了四五年了，除了以 AI 为名如雨后春笋般快速崛起的新创公司们，各家科技巨头也希望围绕这个时髦词“重塑金身”。此外，通过媒体的大肆宣传，机器学习也已经成了一个家喻户晓的名词。总之，机器学习将成为下一个能帮“猪”起飞的风口已经是大家的共识。

在正式开始之前，我们先说说人工智能（AI），机器学习，神经网络和深度学习四者的关联。简单来说，人工智能的范畴最大，机器学习包含在内，它是带来人工智能的方法。至于神经网络，则是机器学习众多算法中的一类，而深度学习则是实现机器学习的技术，是它的一种延伸。

经过这么多年的知识普及，恐怕理解（理论上）神经网络是什么的人已经相当多，至少大家都知道它与范式和数据有关。机器学习让我们能在数据中找到那些暗示性和随机性的范式或结构，而在此之前能找到这些隐含属性的只有人类，因为我们会推理。

有了机器学习，那些原本对人类来说相当简单（或者说无法向计算机描述的问题）但却能难倒计算机的问题就迎刃而解了，各路公司也都拿出了相当炫酷的演示。

不过，笔者依然认为，对于机器学习的定义，整个行业依然没有一个固定的理解，一切都还未尘埃落定。对于科技公司或整体经济来说它到底意味着什么？机器学习到底能解决什么重要问题？它对于普罗大众又意味着什么？如何从结构上理解它的影响呢？

这时有人会抬出 AI 这个术语，不过它其实一个问题都回答不了，它就像《2001 太空漫游》中提到的黑色巨石（代表未解之谜），在它面前我们都是挥舞着拳头吼叫的猩猩，想解构 AI 几乎是不可能完成的任务。

关于机器学习，你所知道的，可能都是错的

事实上，我觉得现在大家能提出一大串无用的方法来讨论机器学习的发展程度。举例来说：

1. 数据是新的石油
2. 谷歌和中国包揽了所有数据
3. AI 将抢走所有工作
4. 只谈论 AI

也许，我们能找个更多有用的角度，比如：

1. 自动化
2. 为技术层赋能
3. 关系数据库

为什么要提到关系数据库呢？因为它们是新的基础赋能层，可以扩大计算机的能力范围。在关系数据库出现之前（上世纪 70 年代末），如果你想让数据库告诉你“住在这座城市里的人谁买了这件商品”，就必须专门搞个定制版的工程项目。也就是说，当时的数据库建立时没有结构，因此想实现任意的交叉引用查询可是个难事。如果你想问个问题，就得有人围绕这个问题下大功夫工作一番。当时的数据库只是一套记录系统，但关系数据库的出现让它们进化成了商业智能系统。

这样的改变也让数据库的重要性陡然增加，新的用例伴随独角兽们如雨后春笋般诞生。关系数据库的诞生给了我们甲骨文和 SAP 公司，而 SAP 和竞争对手们又一同为世界带来了全球无库存式供应链，在这一技术的基础上，苹果和星巴克等公司缔造了自己的帝国。上世纪 90 年代，几乎所有企业级软件都换用了关系数据库，包括 PeopleSoft，CRM 和 SuccessFactors 都是基于关系数据库运行的产品。此役之后，再也不会有人傻兮兮的说“没用的，甲骨文早已吃掉所有数据库”这种话了。相反，这项技术几乎成了所有新事物的赋能层，它已无处不在。

因此，这一思路才是我们现在重新思考机器学习的最佳接地方式，它会给计算机能力带来巨大的跃升，成为不同公司不同产品中的一部分。最终，机器学习也会无处不在，成为大家习以为常甚至都不愿再提的一项技术。

值得一提的是，虽然关系数据库具有规模经济效应，但它提供的确实一个有限网络或“赢家通吃”的效应。也就是说，即使公司 A 和公司 B 买了同一个数据库软件，两家公司也不会从对方那里获益。机器学习也遵循同样的道理，它的一切都与数据有关，但数据又与特定的应用程序息息相关。更多的笔迹数据只会提高它任笔迹的能力，而更多的燃气轮机数据让系统能提前预测故障，但两者并不能相互扶持。这就是其残酷之处，数据是不可替代的。

上面这段话其实彻底攥住了我们对于机器学习普遍误解的核心，即在某种程度上来看，它是一个单一的通用的事物。同时，在理解什么是自动化时我们也犯了相同错误。在每一次自动化风潮到来时，我们都感觉自己在创造一种拟人的且有基本智力的技术。举例来说，上世纪 50 年代，人类开始畅想能做家务和上菜的机器人，结果我们没培养出机器人服务生，反而造出了洗衣机。

关于机器学习，你所知道的，可能都是错的

洗衣机也是机器人，不过它们并非“智能”机器人。它们不清楚水和衣服到底是何物。此外，即使是在洗涤这个分类中，它们也并非通用产品，要不然洗碗机也不会诞生了。简单来说，它们只是另一种形式的自动化，在概念上和传送带没什么不同。同样的，机器学习确实能让我们解决许多现在电脑搞不定的问题，不过这些问题肯定都需要不同的实现方式和不同的数据，甚至是不同的市场策略和开发公司，而这其中的每一环都是自动化的一块拼图，它们是一个个能执行不同任务的洗涤设备。

因此，在谈论机器学习时我们肯定会遭遇“拦路虎”，即我们要在数学的机械论解释和对人工智能的幻想中找到中间立场。

让我们回到与关系数据库的类比话题，现在我们确实能信心满满的说，这项技术能解决大量问题，但你并不知道是哪些具体问题。你能用机器学习进行令人印象深刻的语音和图像识别展示，但普通公司用它来干什么呢？就像一家美国媒体公司说的：“有了机器学习，我们确实能一次给十年的访谈节目做索引，但我们要在索引里找什么呢？”

那么什么才是有真正用途的机器学习洗涤机呢？要解答这个问题，我认为需要用到两种工具。第一种是按照数据类型和问题类型的队列进行思考。

1. 机器学习确实能在你所拥有的数据中快速找到问题答案，你甚至可以将它看做一种分析或优化技术。举例来说，我们的投资公司 Instacart 就打造了一套系统，专门用来优化个人买家通过分散渠道进行投资的路径。这套系统直接将效率提升了 50%，而且开发团队只有三名工程师（用了谷歌的开源工具）。
2. 同时，机器学习还能让你在数据中找到新问题的答案。举例来说，一位正在为打官司做准备的律师可以搜索到包含“愤怒”、“忧虑”或“反常”意味的邮件，这样就比单纯的关键词搜索高效多了。
3. 机器学习打开了新大门，给了我们可以分析的新数据类型。从前计算机无法真正的读懂音频、图像或视频，但未来这一切都有可能成真。

在这三种数据类型中，我发现图像最有趣。计算机诞生伊始，就能处理文本和数字，但图像和视频却是它们的软肋，现在它们不但能读，还能看了。这就意味着图像传感器和麦克风成了一种全新的输入机制，它们摄像头的属性被机读数据流生成器属性盖过。所有的事都会成为计算视觉问题，但这里的计算视觉问题又与当下的计算视觉问题有所不同。

这又与识别“猫片”无关。最近我参观了一家汽车座椅供应商，它们就在自家的廉价 DSP 芯片中灌入了神经网络，而与其配合的则是廉价的智能手机图像传感器。它们搭建这套系统，是为了查找座椅织物中的褶皱。将这套系统称为“人工智能”有些言过其实了，它只不过是将某种此前无法自动化的任务自动化了而已。

这种自动化的感觉是我们思考有关机器学习问题的第二种工具。对人来说，找找织物中的褶皱可用不了二十年的经验积累，因为它太简单了。事实上，我的同事就认为，那些无论如何训练，狗狗都学不会的能力，机器学习都能掌握。这有益于我们思考有关 AI 偏见的问题，但还是有自己的局限性。因为狗狗可没有一般智力和常识，而神经网络可不同。吴恩达就指出，机器学习能在一秒钟之内学走你的能力。

五年之前，如果你给计算机一堆图片来辨认，它们能做的只是区分这些图片的尺寸，而十岁的小孩很轻松就能分辨出照片中的男人和女人，而十五岁的小孩则能看出照片里的面孔酷不酷，而再长大几岁去实习时，人甚至能看出照片中的隐晦的意味。有了机器学习后，计算机的能力马上就提升到十岁孩子的级别，它们甚至能冲击下十五岁的智商。机器学习可能永远达不到实习生的水平，但如果你手上有 100 万个十五岁孩子来保管数据呢？你会命令他们做什么？听什么电话？看什么图片？审查什么文件或信用卡支付呢？

换言之，机器学习不需要成为拥有几十年经验的“老司机”，我们也不是要让专家成为自动化的“牺牲品”。相反，我们对机器学习的主要要求是“接听所有电话并挑出那些生气的人”，“阅读所有邮件并找出那些满是焦虑的邮件”，“看遍成千上万张照片并找到那些照片中的炫酷人类”。

在某种意义上，这就是自动化的惯例。Excel 没给我们人工会计员，PS 也没给我们人工图片设计师。相反，我们大规模自动化了离散的任务。

在某些领域，机器学习可能找不到人类已经认识到的东西，但它们却能找到我们认识不到的或者范式、推论或暗示，就像 Deepmind 的 AlphaGo 那样。AlphaGo 并不会像围棋运动员那样下棋，而是先学会规则随后进行不断的左右互搏。如果机器学习充当着实习生的角色，它们不会一开始就告诉你某张照片很好看，而是在看到第三百万张图片时，发现其中的范式。那么，到底哪个领域小到让我们能告诉机器学习系统具体的规则，以便它们能在数据中挖掘出新的成果呢？

我花了很多时间遍访各家公司以寻找它们的技术需求，在机器学习上显然它们已经有许多即将成熟的果实。不过，这里确实还有许多明显的分析和优化问题，有些则是图像识别或音频分析问题。我们讨论自动驾驶汽车和混合现实是因为机器学习成了它们的催化剂。机器学习让汽车能看到它周围事物的一举一动，至于混合现实，机器学习则决定了头盔佩戴者到底能看到什么。不过，在讨论过织物上的褶皱或呼叫中心的情感分析后，这些公司又有了新问题：“机器学习还有其他能耐吗？它们还能助力什么技术？又能发现什么新机遇？”

在厌烦这些问题之前，我们恐怕还能保持 10-15 年的新鲜感。

via ben-evans，雷锋网编译。

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

4人收藏

大壮旅

编辑

发私信

当月热门文章