首页 理论教育 数据预处理:优化数据质量的关键步骤

数据预处理:优化数据质量的关键步骤

时间:2023-05-24 理论教育 版权反馈
【摘要】:本文采用五分制的李克特量表思想,根据各个不同影响因素的具体的特性进行量化打分,将不同属性的影响因素取值均在[1,5]区间内进行,为方便后继的影响因素实证分析,还需要对数据进行归一化处理,具体的数据处理和内容见表8-4所示。为方便后继的影响因素实证分析再进行数据归一化处理,求解得到的绩效最高值为5,最差值为1,具体区间划分如表8-5所示。

数据预处理:优化数据质量的关键步骤

由于本文构建的影响因素既有定性又有定量两类因素,而且每个变量的数据采集区间范围也完全不同,并且本文后继采用的单因素最小二乘法和BP神经网络均要求变量取值范围在[0,1]之间,因此本文在实证研究各影响因素对网络营销综合绩效影响之前,需要对所有的采集数据进行处理,使这些数据在同一个运算标准内进行运算,以杜绝在随后的运算中出现取值范围和单位表示不一致的情况。本文采用五分制的李克特量表思想,根据各个不同影响因素的具体的特性进行量化打分,将不同属性的影响因素取值均在[1,5]区间内进行,为方便后继的影响因素实证分析,还需要对数据进行归一化处理,具体的数据处理和内容见表8-4所示。

表8-4 网络营销商务综合绩效影响因素度量打分表

(www.xing528.com)

将各个影响因素的取值统一度量到五分制的区间后,为了更好方便地分析各影响因素对于网络营销综合绩效的作用强度,本文将对网络营销综合绩效取值采用同样的方法处理数据,将按照第六章计算得到的各种情况下的综合绩效按照宽度为10%区间划分为九个区间,也采用五分制思想统一度量和量化表示。这里排除了各种极端情况,也即绩效为0或为满分情况,因为本文研究一般情况下的影响因素,不考虑极端市场和企业情况。为方便后继的影响因素实证分析再进行数据归一化处理,求解得到的绩效最高值为5,最差值为1,具体区间划分如表8-5所示。

表8-5 综合绩效归一化区间划分表

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈