一般情况下,总体相关系数ρ是未知的,通常总是根据样本相关系数r作为ρ的近似估计值。但由于r是根据样本数据计算出来的,它受抽样随机波动的影响,抽取的样本不同,r值也就不同,因此,r值是一个随机变量。能否根据样本相关系数说明总体的相关程度呢?这就需要考虑样本相关系数的可靠性,也就是进行显著性检验。
1)r的抽样分布
为了对样本相关系数r的显著性进行检验,需要考察r的抽样分布。r的抽样分布随总体相关系数ρ和样本容量n的大小而变化,当样本数据来自正态总体时,随着n的增大,r的抽样分布趋于正态分布,尤其是在总体相关系数ρ很小的或接近于0时,趋于正态分布的趋势非常明显。而当ρ远离0时,除非n非常大,否则r的抽样分布呈现一定的偏态。在以样本r来估计总体ρ时,总是假设r为正态分布,但这一假设常常会带来一些不良后果。
2)r的显著性检验
如果对r服从正态分布的假设成立,可应用正态分布来检验。但从上面对r抽样分布的讨论可知,对r的正态性假设具有较大的风险,因此通常情况下不采用正态检验,而采用R.A.Fisher(罗纳德·费希尔)提出的t检验,该检验可用于小样本,也可用于大样本。
检验的具体步骤如下:第1步:提出假设为
H0:ρ=0;H1:ρ≠0
第2步:计算检验统计量为
第3步:进行决策。根据给定的显著性水平α和自由度df=n-2查t分布表,查出tα/2(n-2)的临界值。若|t|>tα/2(n-2),则拒绝原假设,表明总体两个变量之间存在显著性的线性关系。
【例8.3】 根据表8.2计算的相关系数,检验不良贷款与贷款余额之间的相关关系是否显著(α=0.05)。
解 第1步:提出假设为
H0:ρ=0;H1:ρ≠0
第2步:根据式(8.3),计算检验统计量为
第3步:进行决策。根据显著性水平α=0.05和自由度df=n-2=25-2=23查t分布表得tα/2(n-2)=2.0687。由于t=7.5344>tα/2=2.0687,因此,拒绝原假设H0,说明不良贷款与贷款余额之间存在着显著的正线性相关关系。(www.xing528.com)
不良贷款与其他变量间相关系数的显著性检验可通过Excel完成。
用Excel计算各相关系数检验统计量的操作步骤:
第1步:进入Excel表格界面,将相关系数矩阵复制在Excel表格界面。
第2步:选中单元格(如本例题选中B8)在“公式编辑行”编辑统计检验量式(8.3),然后单击“确定”按钮。在选中的单元格中,得出t检验统计量的结果,如本例题t=7.5344。
第3步:将鼠标按住B8单元格右下方的填充柄,向右和下方拖动,即可得到各相关矩阵相应的统计检验量。此时,出现的界面如图8.7所示。其结果见表8.3。
图8.7 相关系数t检验统计量在Excel操作图示
表8.3 各相关系数检验统计量
【思考与分析】
根据表8.3输出结果,请读者进行检验和分析。
以上是将变量间的相关关系进行了计算与检验,当两个具有线性相关变量的相关程度较高,且通过了检验后,我们将对如何建立两个变量的关系,以及如何利用建立的模型预测等进行讨论,这就是一元线性回归的问题了。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。