挖掘知识的类型在多数文献和“数据挖掘”软件中称为数据挖掘任务。
①总结规则挖掘。它所要做的是从客户指定的数据中挖掘出(从不同的角度或在不同的层次上)平均值/极小值/极大值、总和、百分比等。挖掘结果运用交叉表、特征规则和统计的曲线图表等表示。
②关联规则挖掘。它所要做的是从客户指令的数据库中挖掘出满足一定条件的依赖性关系。关联规则形如A1~A2,支持度=S%,信赖度=C%,其中S和C为客户指令的支持度和信赖度的门限值。此种关联规则挖掘可以在不同的抽象概念层次上进行。例如R1“尿布~啤酒,支持度=5%,信赖度=50%”与R2“婴儿用品~饮料类,支持度=25%,信赖度=80%”相比,R2 在更高的抽象层次上更为客观,因而有较大的支持度与信赖度,更适合高层决策的需求。
③分类规则挖掘。它所做的是在已知训练信息的特征和分类结果的基础上,为每一种类别找到一个合理的描述或模型,然后再用这些分类的描述或模型来对未知的新数据进行分类。
④群集规则挖掘。它又称为无监督式的分类,其目的在于实事求是地,即客观地按被处理对象的特征分类,有相同特征的对象被归为一类。它与分类规则挖掘的区别在于分类是面向训练数据的,而群集则直接对数据进行处理。在群集化作业中,并不需要事先定义好该如何分类,同时也不需要训练组的数据,数据是依靠本身的相似性而群集在一起,而群集的意义也是要靠事后的解释才能得知。(www.xing528.com)
⑤预测分析。当分类的工作偏向于插入漏掉的数据、预测数据分类或发展的趋势时,此时的工作即为预测分析。所有用来进行分类及估计的技术都可以经过修正之后,通过已知变量数值的训练组数据来得到。其中历史性数据是一个很好的来源。历史性数据可以用来建立模型,以检查近年来观察值的变化。若运用最新数据作为输入值,可以获得未来变化的预测值。像“购物篮分析”就可以预测在超市中哪些商品总是会被同时购买。而经过修正后,也可以通过最新的更新数据来预测未来的购买行为。
⑥趋势分析。趋势分析又称为时间序列分析,它是从相当长时间的发展中发现规律与趋势。
⑦偏差分析。偏差分析又称为比较分析,它找出一系列判别式的规则,以区别客户设置的两个不同类别。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。