首页 理论教育 大数据在制鞋行业的主要分析模型及应用

大数据在制鞋行业的主要分析模型及应用

时间:2023-06-18 理论教育 版权反馈
【摘要】:相关性分析就是通过这种一定的数量关系,来反映相关变量因素间相关关系以及变化规律,从而为进一步分析统计提供参考。在市场研究领域,聚类分析主要应用在明确目标消费群体,划分细分市场,进一步描述各细分市场特征,便于有针对性地筹划相应目标消费群体的工作。图3-17是鞋样销售均价的分布情况。而100元以下价位的鞋类产品则销量最低,仅占总量的3.70%。表3-5中鞋样相关信息的KMO 值为0.526,大于0.5,可以做因子分析。

大数据在制鞋行业的主要分析模型及应用

描述性分析是一种通过各类分析指标(例如平均数、方差、标准差、中位数等)来描述数据的各种特征及其所代表的总体特征的统计分析方法。

相关性分析(Correlation Analysis)是衡量两个及以上相关事物之间相关关系的一种统计分析方法。在现实生活中存在着无数相关性事物及现象,当数量达到一定的规模时,这种关系会显现出一定的数量关系。相关性分析就是通过这种一定的数量关系,来反映相关变量因素间相关关系以及变化规律,从而为进一步分析统计提供参考。相关关系反映出的是,变量之间虽然互不影响,具有依存关系,但彼此之间却没有一一对应的关系[40]

因子分析是一种以提取若干个变量中较少几个具有代表性的共性因子来反映原资料的统计学分析方法。由于原有的各个变量间存在着一定的相关性,因此,因子分析通常是基于相关分析之上进行的。

本书采用主成分分析法(Principle Component Factor)进行分析,分析过程如下:

(1)确定待分析的原有若干变量是否适合进行因子分析

输入原始变量,计算原始变量均值及方差,求得变量间的相关系数矩阵。若相关系数多数未通过检验并且小于0.3,则因子分析法对相应的若干变量不适用。

本书将选取用于分析变量间简单相关系数及偏相关系数的KMO(Kaiser-Meyer-Olkin)检验。KMO值越接近1,则变量间相关性越强,因子分析越适用;越接近于0,则越不适用。此外,Kaiser对KMO检验标准做出了相应规定:KMO>0.9,非常适合;0.8<KMO<0.9,适合;0.7<KMO<0.8,一般;0.6<KMO<0.7,不太适合;KMO<0.5,不适合。

(2)构建因子变量

通过对原始变量组成的坐标系进行平移变换,原始变量作线性变换,求相关系数的特征根(每个公共因子方差)以及相应标准正交特征向量,得出公共因子方差贡献情况。

(3)因子变量的命名解释

通过对载荷矩阵进行正交旋转,保持坐标轴的正交性,使得每个因子的最大载荷变量数最小,从而使得因子变量的专业解释更加简化。

(4)计算因子变量得分

确定因子变量后,计算不同因子具体数据值,作出因子变量得分。

聚类分析(Cluster Analysis)是根据事物本身特性研究个体分类的方法。在市场研究领域,聚类分析主要应用在明确目标消费群体,划分细分市场,进一步描述各细分市场特征,便于有针对性地筹划相应目标消费群体的工作。本书采用最常见的层次聚类法对鞋样信息按照某种方法进行分层,利用因子得分进行聚类分析作散点图,将性质相近的归为一类。

在本案例中,所获取的信息见表3-4。

表3-4 鞋样基本信息、关注次数及关注度一览表

续表

续表

*格利特指的是皮革表面有一层特殊亮片颗粒的复合皮革材料。

图3-17是鞋样销售均价(平均成交价格)的分布情况。实验期间消费者所购买的鞋类产品中,201~500元价位的鞋类产品居多,其中301~400元价位的最多,占总体销量的31.48%,201~300元和401~500元价格的次之,分别为29.63%和24.07%。而100元以下价位的鞋类产品则销量最低,仅占总量的3.70%。

图3-17 销售均价分布情况

图3-18是鞋样销售平均价格折扣的分布情况,即:成交平均价格与商品标价的百分比。从图中可以看出,消费者所购买的鞋类产品多数是61%~80%的折扣,81%~99%的次之,原价销售的产品完全没有。

图3-18 成交价格折扣分布图

图3-19是鞋样款式结构的分布情况。本次参与实验的鞋样产品以条带凉鞋居多,其次是鱼嘴凉鞋,最少的是镂空凉拖和条带凉拖,占比均为5.56%。

图3-19 鞋样款式结构分布图

图3-20是鞋样色系分布情况。实验鞋样产品中,浅色系偏多,占比38.89%;暖色最少,占比7.41%。

图3-20 鞋样色系分布图

图3-21为鞋样色彩搭配数量的分布情况。实验鞋样产品总体避免了色彩花哨,以单色和双色为主。其中搭配两种色彩的最多,占总体的72.22%;单色次之,占18.52%。

图3-21 鞋样色彩搭配数量分布

图3-22是鞋样材质的分布情况。实验鞋样产品中有50%为头层牛皮材质,其次以PU居多,占24.07%。

图3-22 鞋样材质分布

图3-23、图3-24分别是鞋样产品跟高、跟型的分布情况。鞋样流行元素中花式后跟偏多,占27.78%;贴钻和特殊材质次之,分别占比为22.22%和16.67%。

图3-23 鞋样跟高分布

图3-24 鞋样流行元素分布

分别对关注度与鞋样开发信息、关注度与鞋样ERP信息以及关注度与鞋样开发信息进行Spearman相关系数的计算,得到相关结果显示,鞋样的关注度与产品基本信息中风格、销量以及色彩数的相关系数分别为0.513、-0.287、0.318,显著性值Sig.(双侧)分别为0.000、0.035、0.019,全部小于0.05,因此鞋样关注度与其基本信息的风格、销量以及色彩数存在显著的相关性。鞋样关注度与产品基本信息中的原始售价、平均售价、折扣、色彩数和材质的相关系数分别是-0.381、-0.755、-0.885、0.383、-0.392,显著性值Sig.(双侧)分别为0.005、0.000、0.000、0.004、0.003,均小于0.05,故鞋样关注度与色彩数和材质的相关性是显著的。

(1)KMO和Bartlett的检验结果

表3-5 KMO和Bartlett的检验

注:近似卡方表明变量之间的独立程度。

表3-5中鞋样相关信息的KMO 值为0.526,大于0.5,可以做因子分析。Bartlett 球度检验(Sig)用于检验相关阵中各变量间的相关性是否为单位阵,即检验各个变量是否各自独立。此次Bartlett 球度检验Sig.≤0.05(即P<0.05),df(自由度)为136,说明各变量间具有相关性,因子分析有效。

(2)解释的总方差结果

表3-6是鞋样所有相关信息因子分析后经因子提取、旋转后得到4个公共因子对所有原始变量的描述。在因子变量初始特征值中,对应值越大,说明因子越重要,“成分1”的初始特征值最大,由上及下描述因子的方差逐级递减;其方差贡献率也依次减小。提取平方和载入是从初始解中按照一定标准选取的4个公共因子后对总原始变量的解释;旋转平方和载入表示的则是正交旋转后所得因子对总原始变量的解释。

提取方法为主成分分析(下同)。

表3-6 4个公共因子对总原始变量的解释

(3)旋转前后因子载荷阵结果

表3-7是鞋样相关信息的旋转后因子载荷矩阵;分别表示初始因子和旋转后因子可以解释各个变量的占比。主要选取变量的数值大于0.5,同时旋转前后变量值变化较小的作为主要变量。第1因子主要包含了平均售价、折扣和原始零售价,命名为价格因子。第4因子有款式结构和流行元素,命名为流行元素因子。第2因子则包括了关注度的内容,可以定义为关注度因子。第3个因子由颜色和跟型构成,可以定义为外观因子。运用因子分析模型,从已有的变量减少因子的维度,总结出主要的因子更加直观地反映出鞋款产品的特点。

表3-7 旋转后因子载荷矩阵a

a.旋转在9次迭代后收敛。

利用上述因子分析的得分进一步进行聚类分析,最终将鞋样相关信息分为三类并作散点图,如图3-25所示。图中类号为1的区域有6个款,说明它们是属于两个因子得分均较低的一类;类号为2的鞋款最多,说明因子得分1(FAC13)比较高,而因子得分2(FAC23)较低;类号为3的仅两个款号,是两个因子得分均较高的一类。

在本案例中,通过对某公司2016年春季鞋样的基本信息和关注度的分析,得出鞋类消费ERP信息中价格是影响消费者关注度的重要因子。此外,在鞋样开发信息中,鞋款的款式、色彩及材质也是鞋类关注度的重要影响因子之一。

图3-25 聚为三类的因子得分散点图

对某公司消费者发放问卷调查表330份,回收307份,回收率91.8%。通过问卷调查表筛选,以及对应产品校对。最终得到有效样本量为197份,有效率64.2%。本次分析的样本量为197名,其中男性消费者67名,女性消费者130名,分别占总人数的34%和66%。(www.xing528.com)

通过对样本的描述性分析得出,总体、男性和女性消费者的年龄、收入、购买周期、心理接受价格,以及购买产品的材质、颜色、跟高、风格、平均成交价的频率分布情况。

(1)消费者的消费行为描述性分析结果

图3-26是消费者年龄分布情况。消费者总体年龄层主要集中在20~30岁,占比51.3%。女性消费者的年龄层也是主要集中在这一个年龄段。男性消费者20~30岁和30~40岁占比差别没有女性消费者明显,分别占比46.3%和37.3%,说明男性消费的年龄层主要集中在20~40岁。

图3-26 消费者年龄分布情况

图3-27是消费者月收入分布情况。消费者总体月收入主要集中在5000元以下,3000元以下占比34%,3001~5000元占比36%,共同占比达到了70%。男性消费者的月收入主要集中在7000元以下,其中3000元以下占比25.4%,3001~5000元占比28.4%,5001~7000元占比28.4%,共同占比高达82.2%。而女性消费者的月收入主要集中在5000元以下,其中3000元以下占比38.5%,3001~5000元占比40%,共同占比达78.5%。

图3-27 消费者月收入分布情况

图3-28是消费者买鞋的购买周期。不管是总体的消费者,还是男性、女性消费者,他们的购买周期都是主要集中在3~6个月。其中男性消费者显得更明显,女性消费者在3个月以下和6~9个月人数也比较多。

图3-28 消费者买鞋的购买周期

图3-29是消费者购买鞋子的心理接受价格。消费者的心理接受价格普遍在201~400元。

图3-29 消费者购买鞋子的心理接受价格

通过对消费者的消费行为调查,发现该公司品牌消费者的消费群体集中在20~30岁的年轻人。消费者的收入属于中等收入水平,集中在3000~5000元/月。消费者的购买周期主要集中在每3~6个月购买一双鞋,而女性购买频率略比男性高一点,这跟女性消费者爱购物有关。对于鞋子的心理接受价格方面,消费者能够接受鞋子的价格主要集中在201~400元单价的鞋子,男性消费者对于价格可以稍高一点,能够接受400元以上的价格。

(2)消费者所购买产品描述性分析结果

图3-30是产品颜色分布情况。本次调查的消费者所购买的产品中,不管是男性还是女性消费者,都是选择职业色(白色、黑色、卡其色、米色、杏色)的产品偏多,男女分别占比55.2%、59.2%。在男性中还有28.4%的消费者选择了成熟色。

图3-30 产品颜色分布情况

图3-31是产品材质分布情况。本次调查的消费者所购买的产品中,消费者总体倾向于购买牛皮材质的皮鞋

图3-31 产品材质分布情况

图3-32是产品风格分布情况。本次调查的消费者所购买的产品中,消费者总体倾向于购买时尚鞋子。男性消费者购买时尚鞋子的比例达到53.7%。而女性更倾向于购买商务类的鞋子,占比25.4%,还有时尚类和优雅类各占比20.8%和21.5%。

图3-32 产品风格分布情况

图3-33是产品跟高分布情况。本次调查的消费者所购买的产品中,由于男鞋的跟高没有差异性,所以没有分析的必要性。在女鞋中,大多数人还是选择低跟的鞋子,占比44.6%。还有部分选择高跟和中跟,分别占比25.4%和27.7%。

图3-33 产品跟高分布情况

图3-34是产品平均成交价分布情况。本次调查的消费者所购买的产品中,消费者普遍选择了201~300元价位的产品,占比47.7%。而男性消费者,32.8%的消费者选择了401~500元价位的鞋子。

图3-34 产品平均成交价分布情况

通过对消费者购买的产品信息的统计,发现消费者在颜色上倾向于选择黑色、白色、卡其色等基本颜色,而男性这一消费群体,也倾向于选择棕色这种比较沉稳的颜色。鞋子的材质方面,男女消费者都选择了以牛皮材质为主的鞋子,女性消费者也有很多人选择其他材质的鞋子,这跟女鞋的多样性有关。鞋子的风格方面,消费者倾向于选择年轻时尚的鞋子,而女性消费者选择风格上比男性消费者更广。鞋子的跟高方面,男性消费者没有分析的意义。而女性消费者的跟高选择上,女性消费者大多数选择了低、中跟的鞋子;对于特高跟的鞋子,选择的消费者相对较少。鞋子的价格方面,大部分鞋子的价格都是中等水平的价格,集中在201~400元,这也印证了前面消费者的心理接受价格,是集中在一个中等的价位。

分别对男性消费者与男鞋和女性消费者与女鞋做了Spearman相关系数的计算,得到如下结果:消费者的性别与产品风格、跟高和平均成交价这三项的相关系数分别为0.318、0.531、0.390;Sig.(双侧)分别为0.000、0.000、0.000,均小于0.05,即消费者的性别与产品这三项属性的相关性是显著的。消费者的收入与产品跟高的相关系数为-0.141;Sig.(双侧)为0.048,小于0.05,即消费者的收入与产品跟高的相关性是显著的。消费者的心理接受价格与产品平均成交价的相关系数为0.411;Sig.(双侧)为0.000,小于0.05,即消费者的心理接受价格与产品平均成交价的相关性是显著的。

对于男性消费者,消费者的年龄与产品颜色的相关系数为0.298;Sig.(双侧)为0.014,小于0.05,即消费者的年龄与产品颜色的相关性是显著的。消费者的心理接受价格与产品平均成交价的相关系数为0.375;Sig.(双侧)为0.02,小于0.05,即消费者的心理接受价格与产品平均成交价的相关性是显著的。

对于女性消费者,消费者的心理接受价格与产品风格的相关系数为0.241;Sig(双侧)为0.06,小于0.05,即消费者的心理接受价格与产品风格的相关性是显著的。消费者的心理接受价格与产品平均成交价的相关系数为0.314;Sig(双侧)为0.000,小于0.05,即消费者的心理接受价格与产品平均成交价的相关性是显著的。

在做总体消费者的消费行为与产品跟高的相关性分析时,由于男鞋的跟高只有一个高度,所以和跟高进行相关性分析可能存在不准确的因素,可以排除这个选项。对于男性和女性消费这种消费行为与产品分别得到了两组相关关系,这两组相关关系将与后文的因子分析结果结合观察,得出更为准确的结果。

(1)KMO和Bartlett的检验结果

表3-8是总体消费者、男性消费者和女性消费者的KMO和Bartlett 球度检验的结果,KMO取值分别为0.661、0.521、0.612,大于0.5,且Bartlett球度检验(Sig)给出的相伴概率均为0.00。所以适合做因子分析。

表3-8 KMO和Bartlett的检验结果

(2)解释的总方差结果

表3-9描述了因子分析初始解释、提取平方和、旋转平方和后对原有变量总体描述情况。“成分”列(第一列)是因子分析10个初始解序号(本文截取了前面4个,也就是方差贡献主要的因子)。“合计”列(第二列)是因子变量的方差贡献(特征值),它是衡量因子重要程度的指标,“成分1”(第一行)的特征值为2.553(表3-9),后面描述因子的方差依次减少。“方差比”列(第三列)是各因子变量的方差贡献率,表示该因子描述的方差占原有变量总方差的比例。“累积”列(第四列)是因子变量的累计方差贡献率,表示前n个因子描述的总方差占原有变量的总方差的比例。

总体消费者因子分析提取了4个因子,男性消费者提取了3个因子(表3-10),女性消费者提取了4个因子(表3-11)。

提取方法为主成分分析(下同)。

表3-9 4个公共因子对总原始变量的解释

表3-10 3个公共因子对男性群体总原始变量的解释

表3-11 4个公共因子对女性群体总原始变量的解释

(3)旋转成分矩阵结果

采用具有Kaiser标准化的正交旋转法,提取方法为主成分分析。表3-12是总体消费者旋转成分矩阵,可以得到如下的主要变量:

第1因子(Ftotal-1)主要包含了跟高、风格和材质3个变量,将Ftotal-1命名为时尚因子。

第2因子(Ftotal-2)主要包含了平均成交价这1个变量,将命名Ftotal-2为价格因子。

第3、4因子不能提取主要变量。所以总体消费者因子分析最后得到2个因子,分别是时尚因子(Ftotal-1)和价格因子(Ftotal-2)。

同理,表3-13中男性消费者因子分析得到3个因子,分别命名为价格因子(Fmale-1,包含平均成交价这1个变量)、颜色因子(Fmale-2,包含颜色这1个变量)和购买周期因子(Fmale-3,包含购买周期这1个变量)。表3-14中,对女性消费者因子分析得到4个因子,分别命名为时尚因子(Ffemale-1,包含风格、跟高、材质这3个变量)、购买力因子(Ffemale-2,包含收入、心理接受价格这2个变量),第3、4因子不能提取变量,所以女性消费者也只有2个因子。

通过对总体消费者、男性消费者和女性消费者的消费行为以及对应产品的因子分析。从已有的变量降维到现有的总体消费者2个因子,男性消费者3个因子,女性消费者2个因子,更加直观地观察到消费者的消费行为和产品信息。

表3-12 旋转成分矩阵a(总体)

a.旋转在6次迭代后收敛。

表3-13 旋转成分矩阵a(男)

a.旋转在7次迭代后收敛。

表3-14 旋转成分矩阵a(女)

a.旋转在6次迭代后收敛。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈