由于城市交通决策具有很强的后效影响,因此相关决策不能完全忽略“因果”,这成为交通大数据分析的特殊难点。
借助社会学中宏微观融合研究方法成果(Lieberman,2005),以大样本统计分析为主,并辅之以单个或多个案例展开深入调查的嵌套分析策略(nested analysis),为因果推论提供一条可行的研究途径。该方法强调定性分析和定量分析共同的推理逻辑,将这两种因果推理分析模式和策略相互补充,有助于克服可能的偏差来源,辨别出小样本分析和大样本分析单独运作可能产生的虚假结果。图5给出了一个在Evan Lieberman成果基础上少量改进,用于城市交通决策分析的分析模板,将大数据分析技术与传统的模型、仿真等技术融合,以支持相关的问题判断和规律发现。
为实现这一模板所需的关键性技术是宏观态势数据与微观调查数据的链接,通过空间活动链路匹配等手段,已经取得初步突破(孙世超,2017)。
图5 宏观与微观嵌套技术分析流程
Fig.5 Overview of the nested analysis approach
图6 基于决策树C5.0对上海市三个社区居民空间活动与影响因素的关联分析结果
Fig.6 Correlation analysis of the impact factors of residents’s pace activity based on C5.0 model(www.xing528.com)
实际研究中对这一引导性模板并非简单套用,根据实际问题会进行适当调整。以空间活动可预测性研究为例,就演变成为通过类别划分逐步聚焦问题的过程。针对个体的节假日活动区域消费水平、居住社区、经常活动区域的特征、轨道交通使用特征等与工作日空间活动模式(区域集中-活跃度弱、区域集中-活跃度强、区域分散-活跃度强)的关系,基于关联分析获得族群划分如图6所示。不同社区三种活动模式中占有明显比例的族群称为典型族群。
对三个社区三种空间活动模式人群中典型族群,采用兼顾考虑个体访问地点概率与访问顺序的真实熵(Song,2010)计算个体空间活动的可预测性,获得如图7所示的分析结果。对空间活动随机性的深入分析,可以聚焦于少数族群的深入问卷调查。
图7 三个社区不同空间活动模式中典型族群的最大可预测性
Fig.7 The maximum predictability of the typical clusters
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。