0
雷锋网 AI 科技评论按:近日,谷歌 AI 研究员、Keras 作者 Francois Chollet 在个人推特上发布一项关于 Kaggle 冠军队伍使用框架的调查结果,并对结果做了简要点评。我们将原文编译如下。
Kaggle 冠军队伍最爱使用的机器学习工具是哪些?为此,我们对 2016 年以来那些排名在前 5 的团队进行了调查。第一个问题问的就是最爱使用哪些初级框架,很开心看到这些冠军队伍更青睐于 Keras。
第二个问题是关于二级框架的选择,因为团队的胜利一般离不开各种 ML 框架的集合。最终结果显示, Sklearn 排名第一,这说明很多人都倾向于使用 sklearn ——虽然很多时候只是作为辅助框架,用于预处理或评分。
我们分别从 2018 年数据库获得 59 个数据点、2017 年数据库获得 48 个数据点、2016 年数据库获得 13 个数据点——这意味着数据非常新。这些有趣的结果随之引出了一个问题:这纯属个人偏好吗?还有没有其他更多选择?为此,我们试图找到一个明确的模式。
赢得比赛或者发表论文很少是奔着成就最聪明或最好想法的目的。多数情况下,这是一场关于改进想法的游戏。获奖者是比其他人尝试过更多东西的人,因而得以进一步完善最初想法。他们经历更多的「进展循环」- 从一个想法开始、过渡到实施、再到可行结果。换句话说,获胜队伍能够更快地完成这个循环罢了。
这也是 Keras 所能赋予你的优势。
我们经常在探讨如何遵循最佳用户体验进行 API 设计,使 Keras 更易于访问与使用,并对初学者们产生帮助。在现实中,我们发现从优秀产品体验中受益最多的并非初学者,而是世界上最优秀的那批从业者们。这是因为优秀的用户体验能够有效减少设置新实验所需的开销(开发与认知层面的)。这也意味着,你能够更快地进行迭代,并尝试更多想法。最终,这将成为你赢得比赛或发表论文的方式。
我的总结是,Kaggle 冠军队伍之所以以压倒性优势选择了 Keras,并非仅仅出于个人偏好,而是使用 Keras 能够提高获胜的机率。反之,那些采用快速实验策略的人拥有更大的机率选择 Keras。
雷锋网 AI 科技评论雷锋网
雷峰网原创文章,未经授权禁止转载。详情见转载须知。