ICML 2016精选论文 | AI科技评论周刊

本文作者：黄鑫

2016-06-26 17:05

导语：这些论文的内容都代表着深度学习领域理论研究的顶尖水平

上一周，ICML 2016在纽约画上了完美的句号。这个会议（International Conference on Machine Learning）已经逐渐发展为了由国际机器学习学会（IMLS）主办的世界最顶级的机器学习领域会议之一。来自世界各地的机器学习领域的专家们都以论文投稿的方式向大会递交了自己最新的研究成果，其中包括一篇来自百度硅谷实验室的语音识别的论文。

大会主要采用演讲和PPT展示的形式，辅以一定程度上的交流讨论会来进行。整个会议议程已经于24日全部结束，最终评出了三篇最佳论文奖和一篇最具时间价值奖，其中Google的DeepMind独揽了其中的两个奖项，过去的一周里我们选取了大会中一些我们认为比较有意义的论文并进行过翻译，在这里给大家回顾一下。

谷歌ICML获奖论文看像素递归神经网络如何帮图片“极致”建模？

这篇论文获得了最佳论文奖。目前图像识别领域的深度学习通常聚焦于某个特定领域的识别应用，因为概括出一个相对通用的模型不管对算法设计者建立规则和机器概括和学习图像中的规则都是很难的。因此谷歌的这篇通过二维循环特性来进行有效的通用图像识别建模的论文获得今年ICML2016的最佳论文奖也不奇怪了。Google在论文中对自己的方法给出了详细的推导和应用过程，这项进步意味着目前的深度学习算法能得到的训练图片的量得到了很大的扩展，甚至可以将任意图片交给其用来训练。

利用CNN来学习任意图结构

这篇论文的选题同谷歌的那篇类似，也是研究一种通用化的图像识别算法。由NEC欧洲海德堡实验室的Mathias Niepert、Mohamed Ahmed、Konstantin Kutzkov完成。但是在结果上表现的没有Google的算法好，因此没能获奖。

百度ICML论文：端对端中英文语音识别

这篇论文来自百度硅谷实验室，吴恩达也参与了论文的研究和撰写，在这篇论文中，百度使用神经网络代替了传统的语音识别的分析结构，使得算法的适应性得到了提高，表现的结果是算法可以同时识别普通话和英语两种语言。并且可以“兼容”多种方言。百度表示，除了算法的设计，这项研究的进展还要归功于对HPC（超级计算机）的恰当应用，这极大的增加了百度对算法迭代的速度。推进了研究的进程。

这违反直觉的“升噪”方法，反而能很好的解决激活函数梯度弥散的问题

这篇论文的最大亮点在于突破了传统的思维方式，独辟蹊径的改善了梯度弥散的问题。梯度弥散指的是在神经网络层数过多的时候，算法后向传播的途中卷积核的输入落入了函数的饱和区，因此得到的梯度很小，最终可能导致在算法正常发挥的情况下结果偏离正确值。通常来说，一般人的思路是尽可能增加每层的函数和初始值的精确性，但这篇论文反其道而行之，向函数中注入适当的噪音，反而起到了很好的抑制梯度弥散的作用。

阿尔法狗CTO讲座： AI如何用新型强化学习玩转围棋扑克游戏

DeepMind的科学家、围棋团队主程序员David Silver分享了它在增强学习方面应用的论文。如果说深度学习是教机器“认知”，增强学习就是教会机器人“行动”。通过不断的训练、试错来教会机器人或算法在各种情况下做出相应认知的一门科学。因此“下棋”其实也属于增强学习的一种应用。在某种程度上来说。这篇以棋牌类游戏应用为主题的论文其实就是一篇AlphaGo的解密。你们难道不好奇吗~

关注这些最前沿的学术会议能让我们对AI最新的应用的可能性有足够的了解，也是了解国内和国际科研实力对比的一个极好的途径，我们会继续保持关注大型的学术会议，为大家第一时间献上其最新的亮点。

图片来自unist.ac.kr

ICML 2016精选论文 | AI科技评论周刊

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

1人收藏

黄鑫

编辑

发私信

当月热门文章

ICML 2016精选论文 | AI科技评论周刊

谷歌ICML获奖论文 看像素递归神经网络如何帮图片“极致”建模 ？

谷歌ICML获奖论文看像素递归神经网络如何帮图片“极致”建模？