【任务工单5-3】
采集与预处理客户行为数据任务工单
续表
小商从店铺的商家数据后台下载了近一个月的客户行为数据,操作如下:
Step 1:下载数据。从店铺后台下载的客户行为数据表如图5-2、图5-3所示。
图5-2 客户行为轨迹数据表
图5-3 客户浏览数据
Step 2:清洗数据。
在Excel中将图5-2中的数据进行格式整理,再进行数据清洗与预处理。
(1)删除空白值。筛选出原始数据表中2019年9月以外的数据,筛选空白值,进行删除,操作方式如图5-4所示。
(www.xing528.com)
图5-4 原始数据删除操作方式展示图
(2)查找重复值。全选所有数据,单击“开始”|“条件格式”|“突出显示单元格规则”|“重复值”,使用默认格式进行重复值填充。操作如图5-5所示。结果如图5-6所示。
从图5-6中看出,有些文本显示的重复数据是浏览量和收藏量的具体值,这些数据是有效的,不需要删除;如果统计时间、浏览量和收藏量三个值完全重复,则需要删除。
(3)清洗无价值数据。和客户行为轨迹无关的数据,属于客户轨迹数据无效值,需要删除,原始数据中未发现无价值数据。
Step 3:预处理数据。
客户浏览和收藏数据经过清洗之后,需要对数据进行排序等预处理。按“统计时间”列进行升序排序。操作结果如图5-7所示。
图5-5 原始数据重复值操作方式展示图
图5-6 原始数据重复值处理结果
图5-7 客户行为数据排序
客户浏览数据总量小,完全可以通过目测来验证数据并无问题,无须清洗和预处理。
到此为止,客户行为数据采集与预处理工作完成。上司对小商在客户行为数据报表中的处理表示很满意。同时,也给小商提出了新的任务,要求小商对企业客户行为做出分析。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。