这里所说的“重复项”即一个数据表中重复的记录。这样的重复项即为数据冗余,需要去除。
一般来说,规范的系统和数据是不含重复项的。但在实际应用中,产生重复项的原因多半是在原始数据录入之前,业务本身可能存在某种交叠,因此导致所产生的数据有冗余。另一种常见的情况是需要从工作表中获得基础的编码表。例如,在17.2.1小节所举的例子中,需要从销售统计表中获得门店表,即可采用“删除重复项”的方法实现。我们以后者为例进行说明。
操作步骤
【Step 1】 在工作簿中新建一个工作表,并将工作表命名为“门店编码表”。然后,将在17.2.1小节所举的例子中分列出来的“门店名称”列和“门店编号”列的数据通过“复制—粘贴”方式转移到新工作表中(注意:如果是利用公式获得的分列,在粘贴时需要利用粘贴选项中的“值”选项),获得如图17-14左图所示(局部)的包含门店名称与门店编号的表格。显然,由于数据来源于原始统计表,所以包含诸多重复项。
【Step 2】 选定包含数据的单元格区域,如本例中的“门店名称”列与“门店编号”列;单击“数据”选项卡—“数据工具”组—“删除重复项”按钮,弹出“删除重复项”对话框,在其中设定需要进行对比的列,然后单击“确定”按钮,如图17-14中图所示。此时,弹出提示框“提示:有多少条重复项会被删除,将保留多少项”;然后,单击“确定”按钮即可。删除重复项后的效果如图17-14右图所示。(www.xing528.com)
删除重复项的工作也可以利用公式来实现,即通过合并需要对比的列。然后,再通过COUNTIF( )函数进行统计,删除条件计数值大于1的记录。因其过程较为烦琐,在此不再赘述。
图17-14 删除重复项
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。