2014年阿里巴巴大数据竞赛MTy去大赛网
(“去大赛网”整理:www.godasai.com)
|
报名MTy去大赛网
(开始时间)
|
报名MTy去大赛网
(结束时间)
|
推荐专业
|
参赛对象
|
参赛方法
|
2014年3月10日
|
在2014年4月20日前
|
不限
|
全日制高校(研究院所)本科、硕士、博士均可参赛
|
官网报名,网址见下文
|
参赛形式
|
地区
|
报名费
|
主办单位
|
举办次数
|
个人/小队(不超3人可跨院跨校)
|
全国
|
无
|
阿里巴巴集团
|
不详
|
初赛/预赛时间
|
决赛时间
|
获奖名单
|
获奖证书
|
竞赛类别
|
Season 1:2014年3月10日至4月20日;
|
Season 2:2014年4月25日至7月30日;MTy去大赛网
Season 3(即线上赛,实战2014年双11):
|
具体时间不详
|
具体时间不详
|
不详
|
大赛官方网址
|
特别激励
|
|
Season1: 不设奖项,但是会从参赛队伍中选择较优者进入Season 2阶段比赛 MTy去大赛网
Season2: 阶段奖项:MTy去大赛网
一等奖:1支队伍,奖金贰拾万 MTy去大赛网
二等奖:1支队伍,奖金伍万 MTy去大赛网
三等奖:1支队伍,奖金贰万MTy去大赛网
Season3: Season2阶段的优胜者将在天猫实际开发2014年双11线上算法,并有机会赢取100万大奖MTy去大赛网
(上述奖项以决赛答辩成绩的最终名次决定)MTy去大赛网
MTy去大赛网
season2其它奖项:MTy去大赛网
月星星奖:每期月度榜单排名Top10的参赛队成员都将获得搭载云OS的手机一部;MTy去大赛网
优胜奖:决赛全国赛排名Top50的参赛队成员直接进入阿里巴巴校园招聘绿色通道(即招聘流程省略简历筛选及笔试筛选阶段,直接进入面试阶段) ,在校期间均有效;并将获得阿里纪念T恤和大赛获奖证书 ;MTy去大赛网
总决赛Top10的主要参赛队成员可直接入围“阿里星”计划,参赛队的指导老师(如有)将享受天池数据的最高使用权限1年;
|
MTy去大赛网
MTy去大赛网
MTy去大赛网
2014年阿里巴巴大数据竞赛
一、大赛简介
阿里巴巴大数据竞赛是阿里巴巴集团主办,在阿里巴巴大数据科研平台——“天池”上开展的,基于天猫海量真实用户的访问数据的推荐算法大赛。
本次比赛的目的是让广大的高校同学在大数据时代的背景下,有机会学习和利用阿里巴巴的大数据和云计算平台,尝试解决真实的业务与社会问题。
二、竞赛流程
整个比赛分为三季(season):
Season1:2014年3月10日至4月20日,参赛者可以下载少量天猫的真实行为数据,并在本地调试算法,提交结果。
Season2:2014年4月25日至7月30日,参赛者须使用“天池”平台(阿里巴巴自主研发的分布式计算平台),访问海量的天猫数据,并利用Map&Reduce、SQL及各种平台集成的机器学习算法包调试模型、提交结果。
Season3(即线上赛,实战双11):2014年10月至11月,Season2的top选手可以访问天猫,参与2014年双11的真实算法设计,并有机会获取百万大奖。
三、报名规则
参赛对象
全日制高校(研究院所)本科、硕士、博士均可参赛
组队规则
参赛队伍可以是单人组队,或者自由组合,但是最多不超过三人(可以跨学院跨学校)。如果是多人团队,则需指定一名队长,负责沟通事宜。另外每个队伍可以配备指导老师一名。
注:
1.每人只能参加一支队伍;
2.保证参赛队员报名信息准确有效,否则会被取消参赛资格及激励;
3.进入season2后,不允许变更队伍成员;
4.报名时间:只要在4月20日0:00(season1截止)之前报名即可。鼓励大家早点报名,可以早点接触到数据,以确保参赛时间充足;
5.报名方式:官网注册账号后报名即可;
四、赛制安排
环节
|
时间
|
规则
|
Season 1
|
3月10日—4月20日
|
1.利用可下载的少量天猫数据,建模与提交结果。 MTy去大赛网
2.每周提供1次算法提交机会(提交截止时间为每周日凌晨2点),隔天公布排行榜, MTy去大赛网
按照F1分从高到低排序; MTy去大赛网
3.2014年4月20日选出第一赛季最好成绩排名在前500名的队伍进入第二赛季;
|
Season 2
|
4月25日-7月30日
|
1. 参赛者需登录阿里巴巴天池平台,访问海量天猫数据。利用天池平台的集成工具与算法,建模与提交结果。 MTy去大赛网
2. 评审规则:每天提供1次算法提交机会,每天更新排行榜,按照F1分从高到低排序。(排行榜将选择选手在本阶段的历史最优成绩进行排名展示,选手每日的成绩请至个人中心查询) MTy去大赛网
3. 2014年7月24日将重新抽样一批相同量级的数据(保证抽样方式一致),7.30零点截止算法的提交,并取7.24-7.30最优成绩前Top10的参赛队进入最终评审。 MTy去大赛网
4. Top10的参赛队,需要准备评审材料,在8月20日来杭州参加答辩,根据参赛队的算法原理、season2的成绩,决出最终的冠亚季军。
|
Season 3
|
10-11月 (线上赛)
|
邀请决赛成绩TOP3的参赛队参与天猫线上算法的设计,并在双11当天检验效果,根据线上AB Test 结果,决定最终成绩,赢取100w大奖。整个过程将由媒体全程跟踪和监督。
|
五、奖项设置
Season1不设奖项,但是会从参赛队伍中选择较优者进入Season2阶段比赛
Season2阶段奖项:
一等奖:1支队伍,奖金贰拾万
二等奖:1支队伍,奖金伍万
三等奖:1支队伍,奖金贰万
(上述奖项以决赛答辩成绩的最终名次决定)
月星星奖:每期月度榜单排名Top10的参赛队成员都将获得搭载云OS的手机一部(具体手机型号在公布榜单时公布)
优胜奖:决赛全国赛排名Top50的参赛队成员直接进入阿里巴巴校园招聘绿色通道(即招聘流程省略简历筛选及笔试筛选阶段,直接进入面试阶段),在校期间均有效;并将获得阿里纪念T恤和大赛获奖证书
总决赛Top10的主要参赛队成员可直接入围“阿里星”计划,参赛队的指导老师(如有)将享受天池数据的最高使用权限1年
Season3线上阶段奖项:
Season2阶段的优胜者,将会受邀访问天猫,在天猫实际开发2014年双11线上算法,并有机会赢取100万大奖(组委会将在Season2结束后公布细则)
六、主办方
阿里巴巴集团
七、合作方
中国中文信息学会、InfoQ技术媒体、SF社区
附:赛题介绍
本赛题适用于season1 和season 2的比赛,season 3 为线上赛(season 2 赛后公布题目)。
在天猫,每天都会有数千万的用户通过品牌发现自己喜欢的商品,品牌是联接消费者与商品最重要的纽带。本届赛题的任务就是根据用户4个月在天猫的行为日志,建立用户的品牌偏好,并预测他们在将来一个月内对品牌下商品的购买行为。
我们会开放如下数据类型:
字 段
|
字段说明
|
提取说明
|
user_id
|
用户标记
|
抽样&字段加密
|
Time
|
行为时间
|
精度到天级别&隐藏年份
|
action_type
|
用户对品牌的行为类型
|
包括点击、购买、加入购物车、收藏4种行为 MTy去大赛网
(点击:0 购买:1 收藏:2 购物车:3)
|
brand_id
|
品牌数字ID
|
抽样&字段加密
|
用户对任意商品的行为都会映射为一行数据。其中所有商品ID都已汇总为商品对应的品牌ID。用户和品牌都分别做了一定程度的数据抽样,且数字ID都做了加密。所有行为的时间都精确到天级别(隐藏年份)。
评估指标及不同赛季使用数据说明(详略,见官网)
|