Skip to content

ShawnXiha/KDD-CUP-2017

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

数据集及任务描述

数据集:https://tianchi.aliyun.com/competition/information.htm?spm=5176.100067.5678.2.jIKgwp&raceId=231597

问题缘起:

高速路口是众所周知的交通瓶颈,交通拥堵的时候高速路口排成的长龙实在是可怕。 只有能够准确的预测交通流量一些应对措施才行得通. 例如如果能够预测到一小时后会有拥堵, 那么交通主管部门可以立即部署增加收费员或者在上流路口分流交通。 交通流受很多复杂因素影响比如天气,假期,星期几,几点,预测交通流及ETA(预计到底时间)是一个已知的挑战。

如果本次大赛选手能够准确的预测交通流和ETA可以帮助交通部门利用大数据舒缓高速路口的交通状况。

任务

任务1:估计从指定路口到高速路口的平均耗时

为每20分钟的时间段估计特定路线的平均通过时间:

  • a路线: Intersection A to Tollgates 2 & 3;
  • b路线: Intersection B to Tollgates 1 & 3;
  • c路线: Intersection C to Tollages 1 & 3.

提交文件如表1

任务2:预测高速路口平均交通流量

预测每20分钟时间段 tollgates 1, 2 and 3的进出车辆流量,注意 tollgate 2只允许从这里进高速公路,其他两个可进可出 提交文件如表2

图1目标区域路网图

测试集与训练集

目标区域路网topology ( Tables 3 and 4), 车辆轨道线 (Table 5), 路口历史交通流量 (Table 6),天气(Table 7).

测试集

比赛初期使用的测试集为10月18日到24日的数据,如图,红色的时间段为需要选手预测的交通时间段,绿色的为给定的。需要预测的为08:00 - 10:00 以及17:00 - 19:00 内的20分钟时间段。

在3月25日有一次数据交换测试集换成10月25日至10月31日的交通数据

训练集

对于Table 5包含7月19日至 10月17日,Table 6初始数据集包含9月19日至10月17日;3月25日数据交换后两个数据均增加10月18日到24日的数据

## 数据集描述

表3为link特征 如图一条路线由一系列link组成

表4为每条路线组成的link

表5为实际车辆沿着路线从路口到高速路口的时间戳

表6为通过高速路口收费站的车流

表7为目标区域天气状况

评价标准

Mean Absolute Percentage Error (MAPE)

任务1

drt 和 prt 分别为路线r,时间段t上实际与预测的到达高速路口所需时 间,R,T为路线数和需要预测的时间段数

任务2

C 为高速路口-进出组合数 pairs (有5种组合: 1-entry, 1-exit, 2-entry, 3-entry and 3-exit),T需要预测的时间段数需要预测的时间段数, fct 和pct 为实际及预测的该时间段交通流量

About

参加本次kddcup

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors