数据介绍

2018年高校校园大数据竞赛,算法赛介绍并下载数据。

下载数据

5月21日凌晨,开放1-10月份的数据下载

5月26日凌晨,开放11月份的数据下载

登录后可下载数据

1-10月的数据压缩包名为:months1_10.rar
北邮服务器:ftp://10.3.181.88     账号:bupt     密码:123456     (仅支持北邮校园网访问)
农大服务器:ftp://10.3.68.60     账号:cau     密码:123456     (仅支持农大校园网访问)
北师大服务器:ftp://219.224.25.23:7712     账号:bnu     密码:123456     (支持所有网络访问)
注意:在控制面板,Internet选项,高级选项中“使用被动FTP”需要勾选上。默认是勾选上的。
校园网,插上网线下载数据更快哟!
11月数据请在官方QQ群共享文件中下载,文件名:month11.rar




数据介绍

由北邮信息网络中心提供的2017年1月至10月校园内所有手机终端位置的数据,一共有33个不同的地点标识符

数据格式:

phone_id time_stamp loc_id
19886128 2017-01-01 00 1
23091728 2017-01-01 00 1
... ... ...
4529122 2017-01-01 00 2
4549327 2017-01-01 00 2
... ... ...
26552663 2017-01-31 23 33
... ... ...

phone-id: 每个手机的标识符,是从1开始的正整数。
time-stamp: 代表一个小时的时间,如2017-01-31 23表示2017年1月31日23:00-24:00产生的记录。
loc_id: 代表地点,是一个1到33之间的正整数。

答案提交:

每次提交一个有23760(33个地点*24个小时*30天 11月)或24552(33个地点*24个小时*31天 12月)项的csv表单,每项有三个数据,表示地点、时间、预测人数,三个数据之间以逗号隔开,代表了下一个月每个地点每小时的预测人数。数据先按位置从1到33排序,再按照时间排序。

请注意:5月21日-25日,请提交11月的预测结果;5月26日-27日,请提交12月的预测结果。

5月21日-25日提交的结果不会记入排名,26日凌晨将会清空所有队友提交记录

示意图如下:

loc_id,time_stamp,num_of_people
1,2017-10-01 00,90
2,2017-10-01 00,497
...
33,2017-10-01 00,17
1,2017-10-01 01,87
2,2017-10-01 01,389
...
33,2017-10-31 23,120