本章通过挖掘出租车GPS轨迹的历史数据,来预测乘客在某区域某时段的候车时间。采用的算法通过出租车的空车到达时间间隔的概率分布模型来推断乘客候车时间的概率分布模型。如果给定一个乘客候车概率阈值,预测算法就可以计算在某区域某时段乘客以此概率阈值能够等候到空载的出租车所需要的时间[1]。本章使用大规模的某北方城市出租车GPS轨迹的历史数据结合仿真来验证预测算法。实验验证结果显示,对等候到出租车的时间预测准确率平均为75%;对等候到出租车的概率预测准确率大于90%。因此可见,模型可以对一个区域一个时段内的乘客候车时间和候车概率进行大致的预测,从而对乘客的日常生活中的出行起到导向的作用。
国内外的相关研究主要包括微软亚洲研究院郑宇等建立的T-Finder[2]、T-drive[3]和T-share[4]系统;Yang等提出的排队论模型[5]、联立方程模型[6]和网络模型[7]。
在整体思路的基础上,主要运用Matlab聚类分析、编程、仿真等计算机方法,以及统计检验等数据分析方法来进行研究。基本步骤如下:
1)获取出租车轨迹数据,数据来源为网上共享的开源数据某北方城市2009年3月500余辆出租车的GPS轨迹数据。处理和分析所获得的城市出租车的轨迹数据,出租车轨迹数据是多行采样记录,每一行包括车辆ID、经纬度、载客状态(1/0表示有/无乘客)和当前时刻。
2)利用出租车轨迹数据,通过聚类分析进行载客热点提取和空车到达时间计算。载客热点是指上车乘客较多的区域,也是交通需求频繁的区域。对每个热点,生成对应的空车到达时间序列。(www.xing528.com)
3)进行空车到达间隔建模和乘客候车时间建模并利用部分出租车轨迹数据(训练数据)计算模型参数。然后利用剩余出租车轨迹数据(评估数据)进行实验与模型验证。对模型进行评估主要从两个方面进行:一是比较候车时间预测值与仿真得到的乘客候车时间;二是比较候车概率预测值与仿真得到的乘客候车概率。
技术路线图如图3-1所示。
图3-1 技术路线图
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。