首页 理论教育 数据库营销中常用的数据挖掘方法汇总

数据库营销中常用的数据挖掘方法汇总

时间:2023-06-13 理论教育 版权反馈
【摘要】:数据库营销中常用的数据挖掘方法包括描述型的数据挖掘和预测型的数据挖掘。描述型数据挖掘是指对数据进行总结,进行数据的泛化,在泛化的基础上对数据进行高层次的处理,具体可分为数据总结、聚类分析、关联分析。在实际情况下,一种更有用的关联规则是泛化关联规则。序列模式分析和关联分析类似,其目的也是为了挖掘数据之间的联系,但序列模式分析的侧重点在于分析数据间的前后序列关系。

数据库营销中常用的数据挖掘方法汇总

数据库营销中常用的数据挖掘方法包括描述型的数据挖掘和预测型的数据挖掘。

描述型数据挖掘是指对数据进行总结,进行数据的泛化,在泛化的基础上对数据进行高层次的处理,具体可分为数据总结、聚类分析、关联分析。

数据总结的目的是对数据进行浓缩,给出它们的紧凑描述。如计算出数据库各个字段上的总和值、平均值和方差值等,或者用直方图、圆形图等图形方式表示,以实现数据的可视化

聚类分析的目的是根据一定的规则,把样本按照相似性归成若干类别,即“物以类聚”,使得属于同一类别的样本之间的距离尽可能地小,而不同类别上的样本间的距离尽可能地大,在对样本合理划分后,对不同的类进行描述。与分类分析法不同的是,聚类法的样本集是一组未标定的记录,即样本还没有进行任何分类。聚类通常用于将客户细分成不同的客户群,如有相同爱好的客户群。聚类方法包括统计方法、机器学习方法、神经网络方法和面向数据库的方法,例如银行如果要进行一次直接邮递推广活动,我们可以根据对目标市场客户群体的聚类分析使得目标客户更加具有针对性,只寄出少量的信件,就可得到很高的回应率。由于避免了传统的撒网式促销,虽然减少了直接邮递的数量,却能增加盈利。(www.xing528.com)

关联分析是指通过关联规则挖掘寻找大量数据中项集之间的有趣联系。它的主要应用领域是购物篮分析,也可对市场促销活动的有效性进行挖掘。在实际情况下,一种更有用的关联规则是泛化关联规则。因为物品概念间存在一种层次关系,如夹克衫、滑雪衫属于外套类,外套、衬衣又属于衣服类。有了层次关系后,可以帮助发现一些更多的有意义的规则。由于商店或超市中有成千上万种物品,平均来讲,每种物品的支持率很低,因此很难发现有用规则,但如果考虑到较高层次的物品,其支持率就较高,从而可能发现有用的规则。例如银行的交叉销售方式就是建立在关联分析的基础上的,银行利用关联分析方法分析客户的交易行为与其他属性,如客户的年龄、性别、教育程度、职业等的关联关系,即寻找影响客户交易行为的因素,并建立预测模型对客户将来可能发生的交易行为进行预测,分析哪些客户最有可能对银行的服务感兴趣,会对哪些金融产品感兴趣,哪些理财产品或服务通常会一起发生在同一次交易里,从而实施有效的交叉销售,提高银行的客户价值。

预测型数据挖掘是根据已知目标变量值的历史数据,来建立预测模型,具体包括分类、回归、时间序列分析等方法。

分类能将数据库中的数据项映射到给定类别中的一个。分类方法在人们的日常生活和商务领域中普遍存在。如根据财务状况等资料将公司信用分为A、B、C级。分类定义了一种从属性到类别的映射关系,给定样本的属性值,根据已知的模式将其划分到特定的类中;回归分析能通过具有已知值的变量来预测其他变量的值,如对商品的销售量、股票价格、产品合格率等,找到有效的方法进行预测,Logit模型是常用的模型;时间序列分析是用变量过去的值来预测未来的值。时间序列采用的方法,一般是在连续的时间流中截取一个时间窗口,窗口内的数据作为一个数据单元,然后让时间窗口在时间流上滑动,以获得建立模型所需要的训练集。序列模式分析和关联分析类似,其目的也是为了挖掘数据之间的联系,但序列模式分析的侧重点在于分析数据间的前后序列关系。它能发现数据库中形如“在某一段时间内,顾客购买商品A,接着购买商品B,而后购买商品C,即序列A、B、C 出现的频率较高”之类的知识。比如酒店可以用数据挖掘进行交叉营销,由于酒店与出行的上下游关系,可以根据客户属性多维度地进行刻画,将不同维度的属性与酒店消费行为进行交叉、关联,比如在获得航空公司等上游的信息后,精准推荐匹配的酒店;酒店还可以根据客户的商品消费数据,在进店后进行捆绑销售、搭配销售相关产品;通过历史数据,分析出关联数据,如情人节红酒的销量明显增长,酒店还可以提前做到预测。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈