我们在第3章曾用散点图来形象地表示两个定量数据之间的关系。本节介绍两个定量数据之间关系的测度方法: 协方差和相关系数。
4.4.1 协方差(covariance)
协方差测度两个定量数据之间线性关系的强度。下面的公式定义了样本协方差(sample covariance):
[例4.14]根据表3-12中的数据,计算样本协方差。
解: 表4-7是样本协方差的计算过程:
表4-7 协方差的计算过程
协方差作为两个定量数据之间线性关系的测度方法的一个主要缺点是协方差可以有任何值,不能决定关系的相对程度,即不能说6.8378是强的相关性还是弱的相关性。为了更好地决定关系的相对强度,需要计算相关系数。
4.4.2 相关系数(coefficient of correlation)
相关系数(r)是衡量两组定量数据之间线性关系的相对强度。相关系数的数值处于完全正相关1和完全负相关-1之间。通常,若r为正,表明两变量正相关; 若r为负,表明两变量负相关; 相关关系的强弱不依赖于相关的方向( -或+)。相关系数r的绝对值越接近于1,表明线性相关关系越强; 越接近于0,表明其线性关系越弱。特别的情况,当=1时,表示两变量完全线性相关; 当=0时,表示两变量之间不存在线性相关关系。(www.xing528.com)
下面的公式定义了样本相关系数:
式中:
[例4.15]根据表3-12中的数据,计算样本相关系数。
解: 表4-8是样本相关系数的计算过程:
表4-8 相关系数的计算过程
续表
汉堡包的价格和电影票的价格之间存在正相关性,相关系数r=0.8348,说明两者之间存在高度的线性相关性。那些城市汉堡包的价格较高的,其电影票的价格也倾向于较高; 那些城市汉堡包的价格较低的,其电影票的价格也倾向于较低。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。