回归分析方法是数据挖掘中最为基础的方法,也是应用领域和应用场景最多的方法,如果问题域中涉及量化型问题,一般都会先尝试使用回归分析方法来研究和分析。回归分析方法是指利用数据统计原理,对大量统计数据进行数学处理,并确定因变量与某些自变量的相关关系,建立一个相关性较好的回归方程(函数表达式),并加以外推,用于预测今后的因变量的变化的分析方法。根据自变量的个数可分为:一元回归分析和多元回归分析;根据因变量的个数可分为:简单回归(一个因变量)和多重回归(多个因变量,很少见);根据因变量和自变量之间的关系类型或函数表达式可分为:线性回归分析和非线性回归分析。回归分析是一种预测性的建模技术,通常用于预测分析、时间序列模型以及发现变量之间的因果关系。例如,司机的鲁莽驾驶与道路交通事故数量之间的关系,最好的研究方法就是回归。
1.回归分析法主要解决的问题
(1)确定变量之间是否存在相关关系,若存在,则找出数学表达式;
(2)根据一个或几个变量的值,预测或控制另一个或几个变量的值,且要估计这种控制或预测可以达到何种精确度。
2.回归分析预测法的步骤
(1)根据预测目标,确定自变量和因变量。明确预测的具体目标,也就确定了因变量。如预测具体目标是下一年度的销售量,那么销售量Y就是因变量。通过市场调查和查阅资料,寻找与预测目标的相关影响因素,即自变量,并从中选出主要的影响因素。
(2)建立回归预测模型。依据自变量和因变量的历史统计资料进行计算,在此基础上建立回归分析方程(求出合理的回归系数),即回归分析预测模型。
(3)进行相关分析。回归分析是对具有因果关系的影响因素(自变量)和预测对象(因变量)所进行的数理统计分析处理。只有当自变量与因变量确实存在某种关系时,建立的回归方程才有意义。因此,作为自变量的因素与作为因变量的预测对象是否有关,相关程度如何,以及判断这种相关程度的把握性多大,就成为进行回归分析必须要解决的问题。进行相关分析,一般要求出相关关系,以相关系数的大小来判断自变量和因变量的相关的程度。(www.xing528.com)
(4)检验回归预测模型,计算预测误差。回归预测模型是否可用于实际预测,取决于对回归预测模型的检验和对预测误差的计算,本阶段主要计算预测值的置信区间。回归方程只有通过各种检验,且预测误差较小,才能将回归方程作为预测模型进行预测。
(5)计算并确定预测值。利用回归预测模型计算预测值,并对预测值进行综合分析,确定最后的预测值。
3.应用回归预测法时应注意的问题
应用回归预测法时应首先确定变量之间是否存在相关关系。如果变量之间不存在相关关系,对这些变量应用回归预测法就会得出错误的结果。正确应用回归分析预测时应注意:
(1)用定性分析判断现象之间的依存关系;
(2)避免回归预测的任意外推;
(3)应用合适的数据资料。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。