6
2012年,IBM的Watson获得了克利夫兰诊所勒纳大学医学院的录取通知书,作为一名医生院学生开始了求学之旅。Watson是IBM的人工智能,而它进入医学院是在让医生们训练它,用于医学研究。
三年后,你可能想当然地认为,或许Watson至少在对医学的理解上有一些进步了。但从它的同类来看,人工智能的表现很不如人意,甚至不能通过美国八年级的科学测试,更不要说符合医学院的录取标准了。或许Watson当初是走后门进去的吧。
华盛顿大学的计算机科学教授Oren Etzioni和艾伦人工智能研究所最近举行了一场比赛,邀请800个人工智能团队让其AI系统参加八年级(相当于国内的初二)科学测试。如今结果出来了:表现最好的也只答对了60%的问题。换句话说:在座的各人工智能都是……不如中二少年。
对Etzioni来说,这场长达五个月的测试说明了人工智能的发展现状。得益于深度神经网络(模拟人脑神经元网络的软硬件网络)的兴趣,Google和Facebook还有微软等公司的系统在图像语音识别等领域,达到了人类高度的表现水平。但要让机器学会思考,还是一件不太可能的事,他们甚至不能进行对话,也不能通过基本的科学测试。
遥想2011年,Watson在问答节目Jeopardy!上击败了最优秀的人类选手;就在前不久,Google的人工智能还在围棋上战胜了人类职业选手。但对机器来说,这些都没科学测试难。
研究所的科学测试不仅包括知识问答,它还会要求机器理解基本的概念,回答进化适应这类复杂的问题。其中一个多项选择问题是:
一些鱼类成熟后的多数时间都生活在盐水中,但会在淡水中产蛋。它们适应不同环境的能力是什么的最佳例证?
这些多项选择机器还是应付不过来,就算是用神经网络也不行。Etzioni表示,自然语言处理,推理,理解科学书籍上的概念,这些都是更为复杂的挑战,需要很多推理。
虽然多数参赛的人工智能都属于学术机构和独立研究员,但Etzioni认为科技巨头的表现也不会好到哪里去。“Google那样公司的得分很可能高些,但‘集体的智慧’说明了一切,而且参赛的还有一些很聪明的人。”
亲爱的Watson呢?Etzioni说IBM拒绝参加比赛,因为对这类比赛没什么兴趣,更关注解决现实世界中的问题。不过Watson也不是最好的测试对象了,它以前可能主要关注问答比赛,但现在已经是一系列人工智能工具的集合了,也不能代表普遍的水平。
Etzioni测试是对自然语言处理的测试,能用来了解机器能在多大程度上理解人类语言。IBM的服务包括自然语言处理,但自Watson诞生以来,这类技术逐渐更多受到了深度神经网络的影响。正如你能用大量喵星人图片训练神经网络识别猫一样,你也能用对话教它理解自然语言。Google甚至还用这种方式开发了一个聊天机器人,能与你探讨人生的意义。
但聊天机器人并不能让人信服,而且人工智能的现状不取决于单一的技术。在没有通用方法前,我们需要多种机器学习和人工智能工具。就像在Etzioni的测试中,很多参赛者也用了多种工具,但结果仍旧不理想。
不过也有人认为让机器通过科学测试没多大意义,我们关注的应该更深远。完全多项选择题并不是人工智能的目标。像自然语言理解和科学测试,应该是真正的智能程序可以自然掌握的内容,换句话说,通过测试也并不代表真正的智能。既然还无法战胜中二少年,人工智能们还需努力。
via wired
雷峰网原创文章,未经授权禁止转载。详情见转载须知。