您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
人工智能开发者 正文
发私信给杨鲤萍
发送

0

kaggle「疯狂三月」:将 ML 用于篮球赛预测,奖金 $25,000 !

本文作者: 杨鲤萍 2020-02-24 18:28
导语:Featured 比赛类型

雷锋网 AI 源创评论按:近日在 kaggle 官网上,谷歌云与美国大学生体育协会(NCAA)再一次联合推出「疯狂三月」篮球冠军预测大赛。

任何开发者只要能够通过 AI 来预测 NCAA「疯狂三月篮球赛」的冠军,就有机会获得由 Google 提供的$25,000 高额奖金。当然,该比赛属于 Kaggle 上最著名的 Featured 比赛类型,难度可不低。

kaggle「疯狂三月」:将 ML 用于篮球赛预测,奖金 $25,000 !

图片来源: DiAnte Squire on Unsplash

关于 Kaggle 竞赛

相信大部分开发者都对 Kaggle 并不陌生,这是全球顶级的权威性数据科学竞赛平台,为全世界的数据科学和机器学习的爱好者、研究者和创业者提供了公平公正的竞赛平台。

不论你是数据科学小白,还是数据科学高手,在 kaggle 上都可以收获到自己想要的知识、技巧、经验、荣誉,或是高额奖金。

kaggle「疯狂三月」:将 ML 用于篮球赛预测,奖金 $25,000 !

kaggle 官网主页

针对基础入门参赛者,通常可以在 Started 类型比赛中,学习初学者项目以及积攒经验;而针对高级数据科学玩家,高额奖金的 Featured 类型比赛,或者实验研究为主的 Research 类型比赛,都是不错的选择。

除此之外,想招募合适人才的公司,也可在 kaggle 平台上发表需求相关性强的 Recruitment 类型比赛。当然,平台上也有少量超高难度的 Masters 类型比赛,适合大师级别人物参加。

Kaggle 官网地址:

https://www.kaggle.com/ 

「疯狂三月」,将 ML 用于 NCAA 篮球赛冠军预测

每年三月,有一项赛事将吸引全世界篮球迷的眼光,那就是 NCAA 的疯狂三月。NCAA 男子篮球联赛分为三个级别,疯狂三月是 NCAA 男子篮球第一级别联赛锦标赛,也就是季后赛,采用单场淘汰制。因而结合其每年在三月进行的时间特点,这一比赛获得了「疯狂三月」的称号。

 kaggle「疯狂三月」:将 ML 用于篮球赛预测,奖金 $25,000 !

作为如此大型的赛事,比赛最终的冠军当然也是饱受关注。自 AI 迅速发展以来,研究学者们就一直希望能够通过对大数据的科学分析,在金融、医疗、股市甚至偶然性极强的竞技赛事中获得准确的预测结果。而谷歌云与 NCAA 联合举办的「疯狂三月」篮球冠军 AI 预测大赛,也正是希望将数据科学与赛事预测完美结合,更好的发展数据科学领域。

本次比赛要求参赛者具有较高的数据科学研究水平,同时也提供了较高的奖金,属于 Featured 类型的竞赛。比赛分为了两个阶段,在第一阶段内,参赛者可根据历史数据构建和测试模型,这一阶段不计入最终得分,截止日期为 3 月 14 日;而进入第二阶段后,参赛者所提交结果将计入最终得分,并在 3 月 19 日前(格林尼治标准时间)需提交 2020 赛事最终预测结果。当然,选手也可跳过一阶段直接进入二阶段。

kaggle「疯狂三月」:将 ML 用于篮球赛预测,奖金 $25,000 !

数据分析图表

但值得注意的是,「疯狂三月」之所以让球迷们极度疯狂,其紧张激烈的淘汰赛制也是其中非常重要的原因之一。不同于常见的淘汰模式,该篮球赛形式采用的是「突然死亡法」——WIN OR GO HOME,也就「一场定胜负」。因此,即使是 NBA 巨星,如果在一场比赛中表现不佳,同样会被淘汰出局,彻底无缘冠军争夺。正是这样的赛制,也大大增加了结果预测的难度。

不过简而言之,参与 AI 预测大赛的获奖规则即:参赛者通过出题方给予的训练集(包括:男篮与女篮.CSV 类型的文本数据集)建立模型,再利用测试集准确预测出本次篮球赛的详细结果。

kaggle「疯狂三月」:将 ML 用于篮球赛预测,奖金 $25,000 !篮球场建模示例

同时,Kaggle 团队将在「疯狂三月」整个篮球赛赛中刷新排行榜,最终排名前五参赛者将依次获得:第一名$ 10,000、第二名$ 7,000、第三名$ 5,000、第四名$ 2,000、第五名$ 1,000 的奖金。

「疯狂三月」篮球冠军预测大赛地址:

https://www.kaggle.com/c/google-cloud-ncaa-march-madness-2020-division-1-mens-tournament 

数据预测未来发展

目前,在比赛官网上已陆陆续续有一些通用代码、EDA(电子设计自动化)以及其它预测模型相关的文章发布,并向数据科学爱好者们提供了解读。其中,Rmarkdown 向我们详细展示了本次大赛介绍、赛前准备、使用数据以及预测规则等,而一些在数据科学领域还不够老练的开发者,也可以从中获益良多。

kaggle「疯狂三月」:将 ML 用于篮球赛预测,奖金 $25,000 ! 
图片来源:NCAA 官方网站

在过去几年人工智能还未取得较快发展的时候,已经出现了众多采用大数据分析的方法,来对未来的一些结果进行预测,包括:股市、赛况、交易等领域,同时取得了较为科学准确的结果。

而现如今人工智能(AI)领域的快速发展,可以预见的是,数据科学也将对社会带来更大的影响,甚至一些学者认为,它将驱动经济增长,为改善生活质量带来更多机会。

尽管我们暂时无法验证数据科学发展的最终结果是好是坏,但对于 AI 预测这一功能的实力,依旧值得我们重视并加以利用。而这些具有商业意义的 AI 竞赛,更是我们将技术与理论落地的极佳实践环境。在今后的日子里,雷锋网 AI 源创评论也将持续报道更多相关赛事,期待你的关注。

Kaggle 官网详细方案解读:
https://www.kaggle.com/headsortails/jump-shot-to-conclusions-march-madness-eda  

雷锋网 AI 源创评论

雷峰网原创文章,未经授权禁止转载。详情见转载须知

kaggle「疯狂三月」:将 ML 用于篮球赛预测,奖金 $25,000 !

分享:
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说