首页 理论教育 客户行为数据的采集和预处理优化方案

客户行为数据的采集和预处理优化方案

时间:2023-06-04 理论教育 版权反馈
【摘要】:采集与预处理客户行为数据任务工单续表小商从店铺的商家数据后台下载了近一个月的客户行为数据,操作如下:Step 1:下载数据。从图5-6中看出,有些文本显示的重复数据是浏览量和收藏量的具体值,这些数据是有效的,不需要删除;如果统计时间、浏览量和收藏量三个值完全重复,则需要删除。按“统计时间”列进行升序排序。到此为止,客户行为数据采集与预处理工作完成。上司对小商在客户行为数据报表中的处理表示很满意。

客户行为数据的采集和预处理优化方案

【任务工单5-3】

采集与预处理客户行为数据任务工单

续表

小商从店铺的商家数据后台下载了近一个月的客户行为数据,操作如下:

Step 1:下载数据。从店铺后台下载的客户行为数据表如图5-2、图5-3所示。

图5-2 客户行为轨迹数据表

图5-3 客户浏览数据

Step 2:清洗数据。

在Excel中将图5-2中的数据进行格式整理,再进行数据清洗与预处理。

(1)删除空白值。筛选出原始数据表中2019年9月以外的数据,筛选空白值,进行删除,操作方式如图5-4所示。

(www.xing528.com)

图5-4 原始数据删除操作方式展示图

(2)查找重复值。全选所有数据,单击“开始”|“条件格式”|“突出显示单元格规则”|“重复值”,使用默认格式进行重复值填充。操作如图5-5所示。结果如图5-6所示。

从图5-6中看出,有些文本显示的重复数据是浏览量和收藏量的具体值,这些数据是有效的,不需要删除;如果统计时间、浏览量和收藏量三个值完全重复,则需要删除。

(3)清洗无价值数据。和客户行为轨迹无关的数据,属于客户轨迹数据无效值,需要删除,原始数据中未发现无价值数据。

Step 3:预处理数据。

客户浏览和收藏数据经过清洗之后,需要对数据进行排序等预处理。按“统计时间”列进行升序排序。操作结果如图5-7所示。

图5-5 原始数据重复值操作方式展示图

图5-6 原始数据重复值处理结果

图5-7 客户行为数据排序

客户浏览数据总量小,完全可以通过目测来验证数据并无问题,无须清洗和预处理。

到此为止,客户行为数据采集与预处理工作完成。上司对小商在客户行为数据报表中的处理表示很满意。同时,也给小商提出了新的任务,要求小商对企业客户行为做出分析。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈