研究消费者对某种服务需求倾向及影响因素最常见的方法是通过调查问卷的形式,对潜在用户或者已使用该服务的用户进行调研,根据调研的数据结果进行数据建模,用不同的建模方法进行不同影响因素的定量分析。2015年5月,Taekwan采用了调查问卷的方式收集数据,并建立了一个二元混合逻辑回归模型,对北京市内的用户使用分时租赁意愿的影响因素进行了深入的分析[10]。本节将主要详细叙述整个过程,从调查问卷、建模到结果分析。并依据此分析影响居民是否选择分时租赁的关键因素。
1.调查问卷
研究主要针对潜在的分时租赁客户群,包含北京市11个区(同上一节针对的区域)的用户,并且尽量保证选取的调查者足够分散和平均,总共收集到了1000份调查问卷,主要关注了价格、不同类型分时租赁汽车、人口特征等因素对分时租赁用户偏好的影响。调查问卷考虑的影响因素见表5-5。
表5-5调查问卷考虑的影响因素
(续)
2.数据建模
在许多实际问题中,经常出现因变量是定性变量的情况,本例情景下需要找到每个影响因素对分时租赁使用意愿的影响。可用于处理定性因变量的统计方法有判别分析、回归分析和对数线性模型等。处理分类的问题,应用较多的是Logistics回归分析。Logistics回归分析是观察结果与影响因素自变量之间关系的一种多变量分析方法,属概率型非线性回归。Logistics回归分析根据因变量取值类别不同,又可分为二分类回归分析和多分类回归分析。二分类回归分析中,因变量只能取两个值1和0(虚拟因变量);而多分类Logistics回归分析中,因变量可以取多个值。
设X1,X2,X3,…,Xk为一组自变量,Y为因变量。当Y是愿意使用时,记为Y=1;当Y是否定回答时,记为Y=0。用P表示发生肯定回答的概率,用Q表示发生否定回答的概率,显然P+Q=1。
Logistic回归模型为
同时也可以写成
式中,β0是常数项;βk是与研究因素Xk有关的参数,称为偏回归系数。
肯定事件发生的概率P与βx之间呈曲线关系,当βx在(-∞,+∞)之间变化时,P或Q在(0,1)之间变化。设Z=β0+β1X1+β1X2+L+βmXm,则Z与P之间关系的Logistics曲线随Z值的变化以点(0,0.5)为中心呈对称S形变化。
数学上,函数f(p)对X的变化在f(p)=0或f(p)=1的附近不敏感、是缓慢的,且线性化的程度较高。于是,需要寻求一个f(p)的函数g(p),使得g(p)在f(p)=0或f(p)=1的附近时变化幅度较大,而函数形式又不是很复杂。因此,引入f(p)的logit变换,即
通过Logit变换之后,就可将0≤p≤1转换为-∞<Logit(p)<+∞。当f(p)从0变化到1时,g(p)从-∞变化到+∞,这就克服了f(p)函数的不足。而且,在f(p)不是线性关系的情况下,通过Logit变换可使得g(p)对Xi是线性的关系,即有
Logistic回归是一种概率模型,通常用极大似然估计法(Maxium Likelihood Estimate,MLE)求解模型中参数βj的估计值bj(j=1,2,…,k)。
Y为在X1,X2,…,Xk,作用下的肯定事件发生的指示变量,其赋值为
第i个观察对象对似然函数的贡献量为(www.xing528.com)
当各事件独立发生时,则n个观察对象所构成的似然函数L是每个观察对象的似然函数贡献量的乘积,即
最大似然估计法的原理,是使得L达到最大时的参数值即为所求的参数估计值,计算时通常是将该似然函数取自然对数(称为对数似然函数)后,用牛顿迭代法求解参数估计值bj(j=1,2,3,…,k)。
通常可以使用不同统计分析软件求得各个变量的相关系数,本书案例中是通过Eviews输出计算结果。下一节将基于输出的结果,定量地分析各个影响因素对是否选择分时租赁出行的影响。
3.结果分析
整理得到的结果见表5-6。
表5-6 整理后逻辑回归建模运算结果
(续)
相关系数表达了自变量与因变量的相关性,相关性可分为正相关和负相关。P-value表示了这个变量是否是模型中的重要影响因素变量。P-value可以表示自变量可否通过在不同水平下的显著性检验,这里以10%为判别标准,若值小于0.1则可认为自变量通过显著性检验,对分时租赁的选择产生了一定影响。Exp(B)表征增加一个单位的自变量对模型选择分时租赁模式的影响。通过分析各个相关系数和相关系数的P-value可以分析各个影响因素与是否选择分时租赁的相关性及其影响程度。
人口统计特征:在人口统计特征中,年龄、是否为合租居民和是否有汽车对是否选择分时租赁有一定的影响,其中,是否为合租居民的影响相对较弱。较年长的人更倾向于选择分时租赁,不是合租的居民更倾向于选择分时租赁,有车的群体更偏向于选择分时租赁。造成有车群体更偏向于分时租赁的原因可能是更习惯自驾出行,当汽车限行时偏向于选择分时租赁。
出行方式的选择:愿意花费更多的钱坐出租车,乘坐地铁次数更多,选择有遮挡的出行方式和考虑停车位的居民,更愿意选择分时租赁的出行方式。乘坐出租车、出行的成本和选择有遮蔽的交通方式之间有一定的交叉关系,但交叉的效应并不明显。总出行时间、是否选择公共交通出行方式、是否为高峰时间段出行以及是否是单人出行这些因素,对是否选择分时租赁没有显著的影响。另外,调查结果还显示:用户更愿意选择单程的分时租赁方式。
环境影响因素:依据模型拟合结果,发现环境影响因素中,多数变量对分时租赁的选择上并没有显著影响。只有当天气过冷时,更多用户愿意选择分时租赁。可能是因为有遮蔽的出行方式隔离了环境因素的影响。
分时租赁属性因素:在用户选择分时租赁属性因素中,发现用户对分时租赁的花费金额最敏感,且只有这一个变量对选择分时租赁有显著的影响,原出行方式与分时租赁价差越大,用户越倾向于选择分时租赁方式出行。
4.结论
通过对居民进行问卷调查和现场调研的方式收集到的数据,可以从多方面挖掘用户的偏好,更详细地统计和分析用户的实际使用情况,更全面地寻找目标人群。分时租赁运营公司,可以在高校、商圈、大型社区等潜在客户较多的地方,通过发放调查问卷和进行市场调研,发现更多的商机。
逻辑回归模型是一种常用的进行分类计算的方法,通过运用多元混合的逻辑回归模型,可以针对不同因素对用户是否选择分时租赁的影响进行定量的分析。依据逻辑回归拟合的模型,同样也可以对不同类型用户选择分时租赁的概率进行估计,有利于分时租赁运营商定量地确定目标用户群,进行更有目标、更有效率的营销。
最显著的影响因素是分时租赁与固有出行方式的价差,这一定程度上说明,当分时租赁成本相比出租车出行和自驾出行表现出一定甚至更多的经济优势时,用户才更愿意选择分时租赁。分时租赁运营商在对分时租赁定价时,应当考虑到实际消费者可以接受的价格。
有私家车的消费者更愿意选择分时租赁,这一点与预期并没有那么相符,可能有其他相关联的因素没有纳入到考量范围。而有私家车的消费者选择分时租赁的原因可以有多方面,可能是生活水平和收入相对较高,也可能是更熟练的驾驶者,对分时租赁的方式更容易接受。分时租赁的运营商也可以更关注潜在用户或实际用户的相关人口统计学特征,在目标人群中加大宣传和推广力度。
考虑到有停车条件的受访者,更愿意考虑分时租赁的方式出行。目的地的停车条件这个因素,影响了用户对分时租赁出行方式的选择。受访者可能是因为目的地有合适的停车条件,所以选择了分时租赁的方式,这也是发展分时租赁的一个重要目的,解决居民停车困难。虽然运营企业在人口密度大、停车位置紧张的地方发展分时租赁,有利于吸引更多的消费者使用分时租赁的服务,但由于停车资源紧张,承包更多的分时租赁车位,可能会成为分时租赁运营商面临的一大阻碍。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。