“回归”最初是遗传学的一个名词,由英国生物学家兼统计学家高尔登(Galton, 1822—1911)首先提出。他在研究人类的身高问题时,发现高个子父母的子女的身高有低于其父母身高的趋势,而矮个子父母的子女的身高往往有高于其父母身高的趋势。从整个发展趋势看,高个子回归于人口的平均身高,而矮个子则从另一个方向回归于人口的平均身高。后来,人们借助“回归”这个名词,将研究事物之间统计关系的数量分析方法称为回归分析。
回归分析是现代统计学中非常重要的内容,它在自然科学、管理科学和社会经济领域有着十分广泛的应用。回归分析的主要作用是:第一,通过对数量的研究分析,深入认识客观事物之间的相互依存关系;第二,运用回归模型进行分析和预测。
回归分析的一般步骤如下:
(1)收集数据。根据研究课题的要求,系统地收集研究对象有关特征量的大量历史数据。由于回归分析是建立在大量数据基础上的定量分析方法,历史数据的数量及其准确程度都直接影响到回归分析的结果。
(2)设定回归方程。以大量的历史数据为基础,分析其间的关系,根据自变量与因变量之间所体现出来的规律,选择适当的数学模型,设定回归方程。
(3)确定回归系数。将已知数据带入设定的回归方程,并用最小二乘法计算出回归系数,确定回归方程。
(4)进行相关性检验。相关性检验是指对已确定的回归方程能够代表自变量与因变量之间相关关系的可靠性进行检验。一般用R检验和F检验等方法。(https://www.xing528.com)
(5)进行预测,并确定置信区间。通过相关性检验后,就可以利用已确定的回归方程进行预测。因为回归方程本质上是对实际数据的一种近似描述,所以在进行单点预测的同时,也需要给出该单点预测值的置信区间,使预测结果更加准确。
回归分析常用的几个概念是:
实际值:实际观测到的研究对象的特征数据值称为实际值,又称观测值。
理论值:根据实际值我们可以得到一条倾向线,用数学方法拟合这条曲线,可以得到数学模型,根据这个数学模型计算出来的、与实际值相对应的值,称为理论值,又称计算值。
预测值:根据数学模型计算出来的,但与未来相对应的理论值,称为预测值。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
