首页 理论教育 CRM数据挖掘的基本步骤

CRM数据挖掘的基本步骤

时间:2023-05-23 理论教育 版权反馈
【摘要】:下面来看看企业进行数据挖掘时的基本步骤和方法。图7.24 是数据挖掘的过程图,基本上由7 个步骤组成,下面对每一步骤分别说明。图7.24数据挖掘的基本步骤另外,作为数据挖掘的第一个步骤,必须按照项目管理的一般方法考虑其他的因素,如可用的技术、资金、人才和时间等资源投入,确定项目期等。3)数据准备这一阶段是对已确定的基本数据进行必要的转换、清理、填补以及合并工作。

CRM数据挖掘的基本步骤

如果进一步将CRM 分析应用需求进行技术型整理,可以归纳出以下几类数据挖掘需求:

①数据描述和总结。对历史数据描述和总结,可以看清过去发生了什么。

②数据分类。数据分类可以提高市场细分的可操作性和可管理性。

③预测。给出一个或一批预测输入,其结果会如何?

④数据相关性发现。一种行为的发生有很大可能性触发另一种行为。

⑤数据依赖性分析。一种行为的发生以另一种行为为前提。

下面来看看企业进行数据挖掘时的基本步骤和方法。

图7.24 是数据挖掘的过程图,基本上由7 个步骤组成,下面对每一步骤分别说明。

1)确定分析和预测目标

在进行数据挖掘之前,首先要明确企业的业务目标,即通过数据挖掘解决什么样的问题,达到什么目的。比如,进行一次对现有客户的连带销售电话直销活动,可是不知道该选择什么样的客户作为企业的目标客户,这种情况下,问题便可能是“现在客户中谁最有可能正面反馈这次针对产品A的电话直销活动?”在日常工作中,总是要作出这样或那样的决定,数据挖掘虽然不完全肯定里面有无要找的准确答案,但至少可以帮助理清思维,校正可能的误解,这就是数据挖掘的功效。

明确了要解决的问题之后,目标确定并没有结束,必须将要解决的问题转化为可以测量的目标,即数据挖掘的成功准则。显然,必须给出一个质或量的变化才可以测量。比如,要得出客户正面反馈率比过去提高多少个百分比这样的可测量指标,否则,无法确定此次数据挖掘工作是成功还是失败。

图7.24 数据挖掘的基本步骤

另外,作为数据挖掘的第一个步骤,必须按照项目管理的一般方法考虑其他的因素,如可用的技术、资金、人才和时间等资源投入,确定项目期等。即必须有一个明确的计划,以确定挖掘项目的总体项目框架

2)了解数据

确定了要解决的问题以及可以测量的目标之后,必须对数据挖掘的基础数据进行初步了解。比如,数据从哪里获得,数据仓库里有无直接可用的数据集市,所选用数据表哪些字段是必要的,如何描述这些数据等,对数据的初步了解可以帮助分析这些数据的可用性与适用性。另外,也可以用一些简单的工具随机地抽取一些记录检验它们的质量,只有对数据建立基本的可信度之后,才可以进入下面的步骤,否则太多的返工会产生很多不必要的资源浪费。

3)数据准备(www.xing528.com)

这一阶段是对已确定的基本数据进行必要的转换、清理、填补以及合并工作。比如,有些数据挖掘工具只能处理数字类型。在这种情况下,就必须对字段值进行必要的转化。一般数据仓库产品里都有特别的工具做这项工作,可以帮助用户从事数据准备。

数据准备工作比较烦琐,但非常重要。因为,如果数据里噪声大,就会影响建立模型的准确度,数据越完整,越准确,在此基础上发掘的数据规律(Pattern)就具有更高的可信度,从而更好地实现数据挖掘的目标,否则,从“垃圾”数据里再怎么挖掘也只能是垃圾,这是毫无疑问的。

4)数据相关性前期探索

在前面介绍数据挖掘技术时谈到,有些数据挖掘在定性和数据分类方面使用方便,可以用作更高一级预测的“探索”工具。比如,先用决策树或聚类方法帮助找出数据的总体趋势以及预测变量相关性之后,再用神经网络或规则导引方法有针对性地建模。一来可以细化数据,提高性能;二来在某种程度上也可以帮助消除噪声;另外也可以作为不同方法比较之用。

5)模型构造

模型构造阶段是数据挖掘技术应用的关键阶段,有以下几个子步骤:

①选择适用的挖掘技术。根据挖掘目标所要解决的问题,比如是历史数据描述性质的,还是对未来行为进行预测的,选择相应的挖掘技术,因为每一种挖掘技术有其适用性。

②建立培训数据和测试数据。对基础数据必须分为两部分:一个是供模型建立的数据,另一个是供模型建立后检验其准确率的数据。两者的使用目的是不一样的。

③利用培训数据采用相应算法建立模型。这个步骤就是采用相应的算法确定输出和输入的关系,即函数Y=P(a1x1,a2x2,a3x3,…,anxn)中恒定参数an的数值,一旦确定,便称为模型已建立。

④模型解释。模型建立以后必须对模型进行分析和解释,业务专家和数据库专家同时参与,以找出模型中的实际意义。

6)模型评估和检验

这个阶段对所建立的模型用测试数据进行测试,计算误差率,以确定模型的可信度,如果令人不满意,未达到预期的误差率目标,那么,就必须重回到数据了解阶段,重复相关过程,一直找到令人满意的模型为止。当然,也有可能最终放弃导致项目失败,在这种情况下,就有必要重新审视最初的挖掘目标是否合理。

7)部署和应用

如果经过测试和检验,所建立的模型可信,并在预定误差率范围内。那么,便可以按照这种模型计算出输出值,并按照输出值确定决策的基本依据。这样就可以在企业范围内全面部署这个预测模型。在应用过程中,必须不断用新数据进行检验,不断测试其成功概率。经过反复试验成功的模型就成为企业的一个重要的“知识”,为企业成功决策打下良好的基础。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈