0
雷锋网注:本文整理奇点·创新者峰会演讲嘉宾 NVIDIA 全球副总裁张建中的演讲(文字有删减):
NVIDIA 发明了一项技术叫 GPU,20 年前就用在视觉计算上。今天, NVIDIA 几乎所有的业务都是来自于 GPU 这个核心技术上:
第一个业务就是年轻人喜欢的游戏;第二是用于做专业的图形图象设计,大型电影动漫作品都是用 GPU 渲染而来;第三是用来处理人工智能、高性能计算;;第四是汽车的自动驾驶。
NVIDIA 的 GPU 在今年推出一个新产品之后,性能有很大突破,它的成本几乎让所有研究单位都买得起。深度学习的算法,其原理是需要大量的数据采集进行自我学习。可以说没有大数据,就没有深度学习,也就没有人工智能的进步。
深度学习与传统计算机研究并不一样。在以前的计算机研究方法当中,很多是依靠科学家写模型、写算法。但每个人写的程序不一样:聪明的设计师或者程序员,如果写的代码比较准确,模型不错,那计算结果也会准确。但如果有人水平比较有限,那么他制作出来的模型和算法也就有限,因为结果与算法有关。
传统的计算方法就是靠好的专家、老师和学生,不停的培养、研究、优化。深度学习则摒弃了传统算法,用深度学习的神经元网络计算去训练计算机模型。这些模型的原始数据得益于大数据采集:数据越大,训练模型越准确。
我们看到蓝点是传统专家做图形图象识别研究的效果。他过去花很多年,一直到四五年前,他们的顶级水平也就是 70% 左右。但是采用深度学习之后,很快提升到 90% 以上。而今天人眼的识别率是 94.5% 左右。
在真正机器训练之后,你会发现所有机器图形图象识别会胜过我们每一个人。机器的识别准确率将远远超过人类,今天计算机的计算能力、识别能力很强大,这会让人工智能技术有很快的发展。
比如我们今天谈的汽车领域:自动驾驶、辅助驾驶、无人驾驶。所有这些应用,各个不同公司有很大的突破。
但是,我们最终要达到真正的无人驾驶这种顶级水平很难。
首先得有高精地图把路况探测准确,可以定位汽车在路上哪个位置,要能看见周围物体和障碍,最后才决定如何去驾驶。这个原理非常简单,但是要执行非常准确是相当困难的。
那么在这个过程当中,我们到底如何实现汽车的自动驾驶?
用深度学习的方法把数据采集回来,有强大的深度学习计算机,因此我们做了 DGX-1,这个服务器的计算能力相当于 250 个普通 CPU 服务器的计算能力,而它只是在一个小小的机箱当中。这台机器可以让我们所有致力于汽车无人驾驶的研究单位,通过它可以把所有的数据放到这个深度学习系统当中进行测试。
汽车终端用 DRIVE PX 实时使用,不停产生数据,返回到服务器再训练再应用。这样它的驾驶能力和水平就会不断提升。
如果说他采集的数据比较多,尤其是在中国,它的决策会越来越准确,最后在实际使用中就会越来越准确。这也是用深度学习的方式让准确率不断提升。大概过几年之后,汽车驾驶行为的培训和实际使用能力的提升,可以让自动驾驶在实际当中得以实现。
目前这当中最重要的一环是识别汽车周边的物体:准确度很重要。 NVIDIA 自己开发了一个虚拟网络叫 DRIVENET,在通常的图形测试当中我们的准确度已经做到第一位。
如果在不同的状态下,比如在简单状态下可以做到 90% 以上,在最难的情况下可以做到 87% 以上,已经接近于人眼识别。相信通过一系列训练之后,这种图形就可以在实际当中使用。
所有的算法会基于传统的 Caffe、CNTK、KALDI 帮助我们做训练。在实测过程中,它可以在路况当中把所有信息都捕捉回来,计算机可以通过程序来判断驾驶行为。
其中高精地图是最重要的,如果不是高精地图,那么采集回来的数据就会有偏差。我们和很多地图公司合作,把他们的地图变成高精地图。当然有一些国家的高精地图应用需要政府的批准才可以去采集高精地图,否则不能用于民用。
在中国,因为政府对汽车自动驾驶非常支持,所以我们已经有很多公司拿到执照并采集高精地图。像 HERE、TOMTOM、ZENRIN 采集的地图都可以结合到 NVIDIA 的虚拟网络帮助他们进行训练。
如果说依靠高精地图、定位、识别汽车的周围状况,直接进行汽车自动驾驶,这是我们传统的思路。NVIDIA 要打破这些传统思路,我们在想一种方法,怎么能去学习人的驾驶。
每个人在开车的时候,看到的只是前面的前挡玻璃和反光镜、后视镜。那么汽车是不是看到这些图象就可以做自动驾驶?
我们做一个网络就是模拟真正驾驶员的行为。而决定驾驶行为,就是方向盘怎么打,油门、刹车怎么踩,这些是简单的数据。在不同的车况和速度之下,驾驶行为的决策就会有大数据训练模型。
给大家看一个简单的视频:这辆汽车一开始不知道如何驾驶,会犯很多错误。驾驶员在行驶了 3000 公里之后,这辆汽车学会了如何驾驶、如何顺利安全到达目的地。
虽然它已经可以上路,但离实际使用还差很远。我们可以看到一个新方法:它并不复杂,没有地图,不知道前方发生了什么,只是看有什么样的图象之后,车辆模拟驾驶员操作的油门、刹车、方向盘。因此深度学习完全可以采用一种全新方法去做自动驾驶。
我们希望这个方法能给其他研究单位新的启发,来挑战我们传统的计算模式,用新的计算方式建造新的人工智能系统。我们完全可以想像,在深度学习之后,大学当中学的每一个计算模型都会受到挑战,每一个模型都可以用全新的数据方法建立新的人工智能系统,去取代任何自己花了几十年的研究成果建立的模型。
所有的人工智能,无论是做语言还是语音、图象、搜索,都和 GPU 相关。所有传统行业都会利用深度学习去推动新的改革,让新的研究方向达到一个新高度和新的飞跃。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。