实验数据预处理的重要的一个环节是进行出租车空车到达时间计算。
将出租车GPS轨迹数据分为训练数据和评估数据,获得的轨迹数据是大概24天的轨迹数据,分为16天的训练数据和8天的评估数据,分别对训练数据和评估数据进行处理,分别得到对应于训练数据和评估数据的空车到达时间序列,进而得到空车到达时间间隔。
后续的研究中,将利用训练数据得到的空车到达时间间隔对模型进行训练,确定模型参数;利用评估数据得到的空车到达时间间隔对模型进行评估,确定候车时间和候车概率的误差。(www.xing528.com)
具体的实验方法如下:首先,分别筛选出训练数据和评估数据中载客状态为0的数据记录,定为空车位置。这些数据记录就是出租车处于空载状态时的轨迹数据,接下来的工作将会利用这些数据。其次,列出之前生成的10个载客热点,将这10个载客热点定为中心点;以中心点为圆心,以r为半径,确定一个圆形区域,定为热点区域;以中心点为圆心,分别以r-δ和r+δ为半径做两个同心圆,两个同心圆之间的环形区域近似视为热点区域的边界。本章参考相关资料的提示,将r给定为1000m,δ给定为100m。r和δ的确定主要依据经验与估计,可是实验的结果将会证明,这里所确定的值是比较合理的。再次,运用Scala编程语言进行编程,利用已知经度和纬度计算两点之间距离的公式,分别计算训练数据和评估数据中每个空车位置到每个中心点的距离,如果距离在(r-δ,r+δ)范围内,则此空车位置可以视为出租车空车轨迹与热点区域的交点,就是所谓的空车到达,定为空车到达位置。对每一个中心点,筛选出所有空车到达位置,并按照时间顺序进行排序。分别得到对应于训练数据和评估数据的空车到达时间序列,利用Matlab进行简单计算处理,就可以得到相应的空车到达时间间隔。
按照这种方法,就可以分别获得对应于训练数据和评估数据的空车到达时间间隔,以便之后实验的进行。虽然书中所采用的方法进行了相对的简单化,但是从理论上来看,并不破坏实验过程的科学性和合理性,从实际上来看,实验的结论表明过程是基本正确的。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。