1
本文作者: Travis | 2014-09-27 12:58 |
当Google使用16000台机器建造了一个可以正确识别出YouTube视频中是否有猫的仿真“大脑”时,这就标志着人工智能(AI)技术迎来了一个转折点。
这种新兴的AI算法需要应用大量的计算机数据,常被称为“深度学习”。Google仿真大脑号称比现有的图像识别系统的精准度高出了两倍。
纽约时报在2012年写到,这项研究代表着新一代的计算机科学可以被利用来降低计算机成本以及提高了大型数据中心计算机集群的可用性。并可以给不同领域带去巨大进展,例如感知、语音识别、以及语言翻译等方面。
事实上,在过去两年,微软发布了一项利用了深度学习实时把一种语言翻译成另一种语言的Skype服务,Facebook聘请了这个领域著名的专家改进了它们服务的图像识别,Twitter和Yahoo等企业也都收购了涉及深度学习的创业公司。
但是,在这次技术革命期间,一位名为Alex Krizhevsky的研究人员发现,你无需大量的计算机作为服务支撑也能达到相同的目的。在同年发表的一份论文中显示,他的方法至少在一种特定的图像识别测试中优于Google的16000台计算机组成的计算机集群。而他只用了一台电脑。
这是一台昂贵的电脑,配备了大量的内存、顶级的GPU以及专用的计算机芯片。但是这依然只是一台电脑,这表明你不需要像Google一样拥有计算机集群才能利用深度学习能力。
利用这种AI技术还需要一定的专业知识,这就是为什么互联网巨头要储备这么多天才,也正是由于他们有大型数据中心和雄厚的财力,像Google这类公司才可以把这个技术带到全球各地。目前许多数据科学家利用一台计算机——就是普通消费者可以买到的游戏本,并通过深度学习算法解决自身的问题。
在Kaggle,这是一个数据科学家竞相解决其他企业和组织问题的网站,深度学习已成为首选的工具之一,根据Kaggle首席科学家Ben Hamner的介绍,单一的计算机已被用于解决所有事情,包括了图像分析、语音识别甚至是化学信息学。
Richard Socher,斯坦福大学的研究人员进一步扩大了深度学习的使用,现在可以用一台电脑达到识别自然语言的目标。这个迹象表明这些人工智能技术可以造福一些规模较小的公司。这个系统非常容易部署,任何人都可以做到。
与此同时,创业公司都开始构建云服务,提供深层的学习工具,以及推出新的软件和咨询服务。这可以起到推进技术发展使其可以更加平民化的目的。全球只有那么几家公司的计算机集群可以达到Google、Facebook和雅虎的规模,那么单一机器的深度学习会有更加广泛的市场。
GPU是图形处理单元。这些芯片最初是为了快速生成代表游戏和其他高度可视化的应用程序的图形和图像,但由于它们有能力处理数学计算,它们可以胜任各种各样的任务。事实证明,在这些任务中就包括了是深度学习。
深度学习试图模仿人类大脑的神经网络的行为。从本质上说,它创造了一个多层次的软件系统,如果配置正确,当他们分析的数据越来越多,它可以从中训练自己。而传统的机器学习,需要人类工程师进行非常多的手动操作,深度学习是不需要的。
这些多层次神经网络涉及到很多计算机芯片的并行,就像Google这16000台机器,但是你也可以通过GPU进行这种并行处理。最顶级的GPU可以包含超过2000个处理器。
现在Krizhevsky供职于谷歌,他的深度学习创业公司最近被Google收购了,像其他互联网巨头一样,Google正在探索在它自己的深度学习工作中使用的GPU。
在Kaggle,数据科学家们正在使用价值3000美元游戏本研究深度学习算法,其中包括一个单一的显卡。他们正在解决图像和语音识别的问题,而且该技术还可以在其他领域有所帮助。
当然,随着时间的推移,16,000台计算机集群将会更为有用的。Google和Facebook这类公司可以利用集群分析大量的图像和数字声音来训练他们的系统,有这么多集群数量的情况下,进步速度将会非常快。但是,如果你的集群数较小,单一系统仍然可以提供一定标准的人工智能,但是进步空间相对而言没有那么大。
许多深度学习算法都是开源的,这意味着任何人都可以使用它,以及各种创业公司。其中包括旧金山一家名为Skymind的公司,致力于培养在这些算法变幻莫测的数据科学家。Google和Facebook等大公司将引领着人工智能革命,之后会有更多的人将随之加入这场革命。
via wired
雷峰网原创文章,未经授权禁止转载。详情见转载须知。