在监督学习中,如果预测的变量是离散的,我们称其为分类(如决策树,支持向量机等),如果预测的变量是连续的,我们称其为回归。
①相关分析。相关分析是研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法,它是描述客观事物相互间关系的密切程度并用适当的统计指标表示出来的过程。
相关分析研究的是现象之间是否相关、相关的方向和密切程度。为了确定相关变量之间的关系,首先应该收集一些数据,这些数据应该是成对的。当自变量取某一值时,因变量对应为一概率分布,如果对所有的自变量取值的概率分布都相同,则说明因变量和自变量是没有相关关系的。反之,如果自变量的取值不同,因变量的分布也不同,则说明两者是存在相关关系的。
②回归分析。回归分析(Regression Analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,它根据对因变量与一个或多个自变量的统计分析,建立起因变量和自变量的关系。回归分析运用十分广泛,按照涉及的变量的多少,分为一元回归和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。(www.xing528.com)
③相关分析与回归分析。相关分析研究的是现象之间是否相关、相关的方向和密切程度,而回归分析则要分析现象之间相关的具体形式,确定其因果关系,并用数学模型来表现其具体关系。在相关分析中,所讨论的变量的地位一样,分析侧重于随机变量之间的种种相关特征。然而在回归分析中,所关心的是一个随机变量Y对另一个(或一组)随机变量X的依赖关系的函数形式。
一般来说,回归分析是通过规定因变量和自变量来确定变量之间的因果关系,建立回归模型,并根据实测数据来求解模型的各个参数,然后评价回归模型是否能够很好地拟合实测数据;如果能够很好拟合,则可以根据自变量做进一步预测。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。