首页 理论教育 数据分析工具与结果预测的相似性及学习机制建立

数据分析工具与结果预测的相似性及学习机制建立

时间:2023-05-16 理论教育 版权反馈
【摘要】:我们会对数据分析阶段所运用的工具进行研究,但实际上这些工具与第二、第三阶段模型校对后的预测结果和前景有相似之处。图9.3以谷歌地图作为外部浏览器与主界面相连接,对专题地图、流、柱状图等数据进行可视化处理使用相似的图层,我们可以对校对结果和预测结果、观测情况与预测结果进行比较,从而建立起不断循环的学习机制。

数据分析工具与结果预测的相似性及学习机制建立

工具栏引导并指示用户按照模型运行阶段顺序从数据一路指向预测结果,而第二工具栏负责控制图形输出,分别在三个关键阶段当中产出图表。我们会对数据分析阶段所运用的工具进行研究,但实际上这些工具与第二、第三阶段模型校对后的预测结果和前景有相似之处。工具栏包括10种主要展示方式,其中有7种是不同种类的地图:柱状图展示各个地点的活动量、专题地图标注各区域活动量、流量图展示某一起点到全部终点(反之亦然)的交通流量。同时,这些图表可以用交互式表单来查询单个地点和流的情况,尽管大多数情况下,每一次地图生成的时候数据就已完全展现在地图之中过了。计数数据和密度数据有一个很关键的区别,比如人口数量{Pj}是一个定值,与之相对的人口密度就是{Pj/Aj},而此处Aj是指区域j中用作住宅区的土地面积。其他变量也可以根据不同土地用途定义为各类用地的人口密度。

用户可以通过第一个按键来查询某一地点,或许人口流动、就业流动(密度和数量)以及从起点到终点乘坐任意交通工具k所形成的交通流动等数据。第二个按键则能够把这些信息整合成完整的地图,然后输出到谷歌地图上进行查看。这些按键能够按照不同用地性质形成专题地图,然后生成分析数据(如当地活动频率Pj/Ej),用户再根据此来标绘出行数据,例如用散点图来表示流量和与之相对的交通能耗。按键激活地图的同时,从任意起点采用任意交通方式到达所有终点所需要的能耗都能显示出来(反之亦然),此外还有根据当地潜力、消费剩余和相关指数生成的从特定以某种交通方式起点到终点可达性分区图。最终版的地图上会反映出薪资和房价,这些数据没有在任何应用中使用但已经作为交通流的相当形式嵌在扩展模型当中,同时,人口限制也会通过土地可获得程度体现出来。最后,我们让用户利用任意地点的数据生成树状图,它能够以比例矩形的方式有效表示出每个隶属于某地区(此案例中特指伦敦各自治市)的小区域活动量。

图9.2 探索模型数据产生的一些图表

注:a.人口密度;b.就业数量;c.从希斯罗区域6出发的公路交通;d.从希斯罗出发的交通能耗;e.地铁的潜在可达性;f.特区级和村级居住区树状图。

在图9.2中,我们通过一小部分图表表达了人口密度、就业数量、从六区西部机场出发的公路交通、能源消费、可达性,以及居住区分布树形图。利用这些图表我们可以了解区域结构,从图9.2a和9.2b中更可以看出,该区域在就业密度和数量上体现出很强的单中心特质。需要注意的是重点路段收费区是根据机场的道路可达性选择的,但是与市中心轻轨和地铁的交通能耗图几乎没有关联。为了完善可视化效果,我们可以将一些图层中的信息导入谷歌地图,在图9.3中,我们展示了如何以柱状图表现就业情况,以专题图层表现人口密度,以3D地图表现6区的公路交通流量情况,随着模型不断通过各种媒介生成相关数据,我们可以不断更新可视化成果。图9.3仅仅展示了很少的一部分潜力,我们用这种方式能够对很多问题展开探索。

(www.xing528.com)

图9.3 以谷歌地图作为外部浏览器与主界面相连接,对专题地图、流、柱状图等数据进行可视化处理

使用相似的图层,我们可以对校对结果和预测结果、观测情况与预测结果进行比较,从而建立起不断循环的学习机制。探索不同活动的影响和互动网络的变化也可以采取同样的表达方式。然而,为了推进进程,首先我们需要处理交通能耗数据,使之与其他消耗相关联,然后我们可以为模型选择吸引因子,也就是土地面积Aj的函数。在本模型中,我们只采用上文中方程9.8和方程9.12中提到的变量。首先我们通过迭代方式启动模型校对,确保再现方程9.1中的出行长度,然后用衰减牛顿迭代法爬山算法)确保尽快出现汇合点(详见Batty,1976)。至于我们在这里阐述的模型的适应范围是比较适当的,它能够表达62%的人口变动和43%的整体交通流量矩阵。由于本文的主题目的只是介绍一种典型的城市仿真框架,并不需要对其结果做出评价,因此我们把最简单的不加限制的模型呈现如下:

该模型并不是适应性最强的模型,适应性强的模型要包括薪资、物价、土地面积制约等,这样的模型我们会在稍后进行分析。在图9.4中,我们展示的是典型的表现人口数量和密度的模型形式。

图9.4 模型对于居住人口的预测

注:a.预测人口和实际人口;b.比重差距(灰色指预测过量,黑色指预测不足);c.比重差距条形图(灰色指预测过量,黑色指预测不足)。

最后一个阶段要进行场景影响测试。这些场景是由不同的输入变量产生的——就业、交通能耗、用地制约等。用户可以导入含有场景的数据文件,或者也可以利用主窗口的可视界面生成场景。在图9.5中我们展示了其中一种界面,表明了用户如何通过增加交通路线来丰富交通网络,在该案例中,新增的路线是从西部机场到某一中心火车站。把该数据输入模型即可重新得出该交通工具通行的最短路线。这样一来就收集到了测试所需的未来场景。我们可以根据它的出现做相关的预测并在第二工具栏中对这些预测结果做出探索,产生图标。现在我们可以对三组结果进行对比:实际数据和校对后数据,实际数据和场景预测数据,校对数据和场景预测数据。实际上,真正应该比较的是最后一组结果,因为所有由于模型导致的错误都会被包括进来。因此,当我们研究变化和影响尺度的时候,更恰当的做法是对比校对结果和预测结果,而不是实际数据和预测结果。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈