图17-11 从一家上市公司的供应链系统中所导出的局部数据
某些应用中生成的Excel数据常常由于原系统编码或其他原因,导致数据项目文本之间有“粘连”,即相关文本被放入一列。遇到这种情况,就需要进行分列处理。
如图17-11是从一家著名的商超上市公司的供应链系统中导出的数据。很显然,这是系统在进行了一定的汇总以后生成的数据。但是,在汇总时,系统将门店的编号和名称合并到了一起,同时也将商品的名称与编号合并到了一起。这种合并也许是为了某些沟通的方便,但对于进一步的分析、统计是不利的。因此,数据清洗的第一步就是将门店编号与名称分列出来。
操作步骤
【Step 1】 在需要分列的数据列右侧插入一个新列;然后,选定需要分列的单元格区域,单击“数据” 选项卡—“数据工具”组—“分列” 按钮,弹出“文本分列向导”对话框。如图17-12左图所示。
图17-12 “文本分列向导”对话框(www.xing528.com)
【Step 2】 文本分列的第1步是确认分列的依据,选择是基于“分隔符号”还是按照“固定宽度”进行切分:如果单元格中需要分开的文本之间有某种分隔符,那应按照前者进行分割;如果文本有固定宽度,则按照后者进行分割。选择后,单击“下一步”按钮,进入文本分列的第2步。
【Step 3】 当基于分隔符进行分列时,可以同时选择各种分隔符号,即允许同时具有多种分隔符。如果是特殊符号,例如左括号“(”,则选择“其他”选项并在录入框中录入符号(录入时注意观察原数据的符号是半角符号还是全角符号,不可弄错)。如果按照固定宽度进行分列,在第2步中即会在预览区上方出现分割标尺,此时只需在标尺上单击分列位置。确定好分隔符或分隔位置后,单击“下一步”按钮即可。如图17-12右图所示。
【Step 4】 在“文本分列向导”对话框的第3步中可以确认分列数据的类型和目标区域,一般保持缺省的“常规”或选择“文本”选项即可。当然,特殊情况可能需要分列出日期或者数值型数据,此时还可以设置格式。最后单击“完成”按钮,即将“粘连”在一起的整列文本分割开来,并将后一部分放入在【Step 1】中插入的新列之中。如图17-13所示。
图17-13 “文本分列向导”对话框的第3步及分列效果
在分列后的新列中,单元格文本中的右括号“)”可以用替换(可使用快捷组合键“Ctrl+H”)的方法一次性去除。
凡是全角字符(如汉字等)与半角字符“粘连”在一起的情况,均可利用LEN( )和LENB( )函数之间的差异来进行分列处理。例如,在上述例子中,只需在新插入的“D列”(即原E列)的单元格中录入公式“=LEFT(C2, LENB(C2)-LEN(C2))”后按下回车键,然后进行向下填充,即可分列出“门店名称”列。在另一个新插入的“E列”(即原F列)中录入公式“=MID(C2, LENB(C2)-LEN(C2)+2, 6)”后按下回车键,然后进行向下填充,即可分列出“门店编号”列。当然,这里利用了门店编号均为6位字符的特征。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。