1
本文作者: 黄鑫 | 2016-08-08 14:37 | 专题:「CCF - GAIR」全球人工智能与机器人峰会报道专题 |
微软研究院看起来没有缔造了AlphaGo的DeepMind那么耀眼,微软这个公司也不像苹果、谷歌那样天生自带一种“潮”的光环。从Vista开始,微软的每一代产品几乎都被一边倒的看衰。当WP+诺基亚这个不争气的组合一点点失去市场份额的时候,不知道有多少人认为微软会从此走向衰亡。
而微软研究院作为微软内部极其重要的科研机构,不仅是人工智能,微软的几乎所有产品都有它们的研究成果在里面。看着微软的命运浮浮沉沉,很难想象他们的压力会在一种什么水平。
不过令外界可能有些意想不到的是,微软研究院并没有给那里的科学家们施加压力,时至今日,微软研究院仍然是想要抛开外界的纷扰,安安静静做研究的学者们一个相当好的去处。而微软研究院也在以一种相当宽广的胸怀理解和尊重他们的每一个决定。而在看似绝望的逆境之中,微软竟在大火的人工智能领域硬生生的杀出了一条血路,凭借小娜和小冰确立了自己的地位。
事实上,站在更长远的尺度上去观察,才能明白微软研究院同谷歌、Facebook、Uber这些公司的人工智能实验室的最大的区别:除了少数几家超级大公司的人工智能实验室外,很多公司的人工智能实验室多少有点跟风的意味。感觉就像今天深度学习带来了一波新的人工智能浪潮,所以很多公司建立了人工智能实验室。但微软研究院的建立时间甚至比他们中的大多数公司都要早。
在雷锋网对微软亚洲研究院常务副院长芮勇博士的采访中他告诉我们:微软亚洲研究院成立于1998年,而微软研究院的总部早在1991年就成立了,91年的微软还是一家比较小的公司,但那时的比尔盖茨已经对未来有了清晰的愿景。他愿景中的一项早已广为流传,现在在很多地方已经成为了现实:希望每个人家的桌子上都有一台电脑。不过他另一项不那么为人所知的愿景其实同样重要:希望电脑能像人一样,看懂和听懂外面的世界,并像人一样进行思考和推理。
微软研究院就是为了达到这个目标而建立的。芮勇说,他认为在这样的微软研究院其实有三个使命:一是要把计算机领域内所有分支技术的水平,包括计算机视觉、机器学习、语音识别、分布式系统、 人机交互等等这些领域,不仅做到最好,甚至要推动这些领域的水平向前发展。二是不仅关注技术,还要将这些最新技术转化为生产力,应用到微软的产品中去,提升用户的使用体验。三是作为一个类似智囊团的角色,为微软未来五到十年的发展提供一个思路、方向。
芮勇说:微软亚洲研究院成立仅仅几年后就开始迅速在各大学术会议上大量的发表论文。有一年的SIGGRAPH上几乎三分之一的论文都来自微软亚洲研究院。这无疑体现了微软在学术上的投入和实力。而微软也成功的将这些技术应用到了微软的产品中。从各代Windows、Office、XBOX。到现在大火的几款产品,都有微软亚洲研究院和总部将技术转化为生产力的过程在里面。
而微软研究院给在人工智能领域给微软定下的发展方向最终聚焦于人机交互。这点也坚定的体现在了微软的产品中。目前人机交互中极其重要的一环就是搜索服务,虽然微软并不是一家做搜索引擎起家的公司,但在微软研究院的提醒下它毫无疑问的认识到了“搜索”的重要性。在对兼容性和UAC的漫天指责中,Windows VISTA有一个很重要的新特性被忽略了:那就是第一次在很多前所未有的地方出现的搜索框。尽管没有被人过多的注意过,但这个搜索框在后面的系统里被一直保留了下来,直到在Windows10里与小娜完成了一个完美的融合。而微软现在还有自己的搜索引擎Bing。
小娜和小冰,以及其使用的一系列语音识别技术的研发并不是一件容易的事。芮勇博士在采访时还举了另外一个例子:Skype translator——微软研究院的语音组研发的一款即时语音翻译软件。在这个产品中对各个环节的效果的要求甚至比小娜和小冰中更高。Skype translator的处理过程有四个环节:
一是把其中一方的人说的话转化为文本。
第二,是因为人们日常交流的时候用的都是口语化的表达方法,软件需要把这些话语中的那些对实际意义没有帮助的口语化表达给删掉。
第三就是把一方语言的文字实时翻译成另一方语言的文字。
第四就是把这段话用同样的腔调和语气给另一方播放出来。
这四个环节是互相串联的,其中每个环节的成功率如果不能做到够高,那么最终的成功率就会受到很大的影响。
不同于中国本土,Skype在世界范围内的网络电话市场占有率相当高,图片来源,technewstoday
在语音识别、图像识别的各个领域,微软研究院的研究都在有条不紊的推进着。然而正如前面所说,微软最近的路途可谓一波三折。
微软在产品中一直坚持“移动为先”的战略,这个战略是指微软希望提供一种能横跨所有设备的完美体验,这个大方向其实没有问题,但魔鬼都出在细节上:微软将“横跨所有设备的完美体验”理解为了“横跨所有设备的统一体验”,而没有意识到——比如移动端的用户需求和使用体验其实同桌面端是完全不同的,微软太过用心的想在手机上打造一个“Windows”,却忽视了移动端对操作系统真正的需求。
作为一个专注于科研探索的机构,微软研究院很可能经常会面临这样的窘境:自己投入大量心血研发出来的产品最后却得不到市场的认可。但即使这样,微软研究院的定位和研发思路、方式却从来没有受到过影响。
芮勇博士对此的态度是:微软研究院的主要工作就是对计算机科学的基础和应用研究,而这些研究其实都是创新,是为了创建一个我们心中的美好未来。但是未来其实是不可预期的,我们相信的未来里每一件事都会是正确的吗?这其中一定是有所偏差的。
但是我们有一个信念:我们的研究过程其实可以看作是一个个实验,历史上很多伟大理论和技术的诞生都是基于大量的实验的,而这些实验中有很多都会面临失败的命运。可如果我们因为实验的失败就放弃了,那我们永远也不会有颠覆性的创新。所以我们关注的重点不是失败,而是如何从失败中学习,去酝酿下一个实验,到最后把未来给实现出来。
而且对于我们做技术研究的,其实每天都在找方向。如果项目没有成功,可能对于外界来说就是一种失败了,但对于研究人员来说,其实他们恰恰把这个找方向的过程当成一种乐趣。这种心态让他们即使面对失败也不会觉得郁闷。
总之我们是鼓励我们的研究员去想象未来,去想新的想法,然后去大胆尝试。试的时候,有失败,就再去试。
微软亚洲研究院被称为互联网界的“黄埔军校”,同这种包容和富有远见的理念和心态是密切相关的。或许这也是微软在经历了如此多的挫折后还能屹立不倒的原因之一:同诺基亚不同,微软其实在某种程度上看到了未来,只是庞大的身躯没能让自己快速跟上时代的脚步,而现在这个巨人正在调整自己,适应新的时代。芮勇在采访中说,微软现在会将一些科研创新的尝试先对外开放,从而快速获得用户反馈而对自身进行改进。当年的小冰就是一个很好的例子。而这些无疑能帮助微软更好的调整自己,不受一时的成败影响,而将全部目光聚焦于最终的成功。
题图来自ccf.org.cn
雷峰网原创文章,未经授权禁止转载。详情见转载须知。