首页 理论教育 相关关系的描述及测度优化

相关关系的描述及测度优化

时间:2023-07-03 理论教育 版权反馈
【摘要】:图8.1不同形态的散点图从图8.1可以看出,相关关系的表现形态大体上分为线性相关、非线性相关、完全相关和不完全相关等几种。表8.1就是该公司所属的25家分公司2015年的有关业务数据。2)相关系数通过散点图可以判断两个变量之间有无相关关系,并对变量间的关系形态作出大致的描述,但散点图不能准确反映变量间的关系强度。对比散点图8.2和图8.5,十分清楚地看出与计算得到的相关系数r结论是一致的。

相关关系的描述及测度优化

相关分析就是对两个变量之间线性关系的描述与度量,它要解决的问题包括:

①两个变量之间是否存在关系?

②如果存在关系,它们之间是什么样的关系?

③变量之间的关系强度如何?

④样本所反映的变量之间的关系能否代表总体变量之间的关系?

通常我们采用“散点图”来判断两个变量之间的关系形态,若呈线性关系,则再利用“相关系数”指标来测度两变量间的关系程度,通过对相关系数的显著性检验,以判断样本所反映的关系能否代表总体中两个变量的关系。

1)散点图

对于两个变量x和y,通过观察或试验可得到若干组数据,记为(xi,yi)(i=1,2,…,n)

◎定义8.3:用坐标水平轴代表变量x,纵轴代表变量y,每组数据(xi,yi)在坐标中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的二维数据图称为散点图(scatterdiagram)。

散点图是描述变量之间关系的一种直观方法,从中可以大体上看出变量之间的关系形态及关系强度。图8.1就是不同形态的散点图。

图8.1 不同形态的散点图

从图8.1可以看出,相关关系的表现形态大体上分为线性相关非线性相关、完全相关和不完全相关等几种。就两个变量而言,如何两个变量之间的关系近似地表现为一条直线,则称为线性相关,如图8.1(a)和(b)所示;如果变量之间的关系近似地为一条曲线,则称为非线性相关或曲线相关,如图8.1(e)所示;如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,称为完全线性相关,如图8.1(c)和(d)所示,这实际上就是函数关系;如果两个变量的观测点很分散,无任何规律,则表示变量之间没有相关关系,如图8.1(f)所示。

在线性相关中,若两个变量的变动方向相同,一个变量数值变化(增加或减少),另一个变量的数值同方向变化(增加或减少),则称为正相关,如图8.1(a)所示;若两个变量的变动方向相反,一个变量的数值增加,另一个变量的数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,则称为负相关,如图8.1(b)所示。

【例8.1】 一家投资公司在多个地区设有分公司,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的投资。近年来,该公司的贷款额平稳增长,但不良贷款额也有较大比例的增长,这给公司业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用公司业务的有关数据做些定量分析,以便找出控制不良贷款的办法。表8.1就是该公司所属的25家分公司2015年的有关业务数据。

表8.1 某投资公司2015年的主要业务数据

管理者想知道,不良贷款与贷款余额、应收账款、贷款项目个数、固定资产投资等因素是否有关?如果有关系,它们之间是一种什么样的关系?关系强度如何?试绘制散点图,并分析不良贷款与贷款余额、应收贷款、贷款项目个数、固定资产投资额之间的关系。

解 用Excel绘制的散点图如图8.2—图8.5所示。

从各散点图可以算出,不良贷款与贷款余额、应收贷款、贷款项目个数、固定资产投资额之间都具有一定的线性关系。但从各散点的分布情况看,不良贷款与贷款余额的线性关系比较密切,而与固定资产投资额之间的关系最不密切。

图8.2 不良贷款与贷款余额的散点图

图8.3 不良贷款与累计应收账款的散点图

图8.4 不良贷款与贷款项目个数的散点图

图8.5 不良贷款与固定资产投资额的散点图

【思考与分析】

从散点图8.2—图8.5中,请读者分析不良贷款与哪一个影响因素的关系最密切?为什么?

2)相关系数

通过散点图可以判断两个变量之间有无相关关系,并对变量间的关系形态作出大致的描述,但散点图不能准确反映变量间的关系强度。因此,为准确地度量两个变量之间强度,需要计算相关系数。

◎定义8.4:根据样本数据计算的度量两个变量之间线性关系强度的统计量,称为相关系数(correlation coefficient)。

若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ;若是根据样本数据计算的,则称为样本相关系数,记为r。相关系数的计算采用积差法(它是由英国统计学家KarlPearson提出的方法)。样本相关系数r的计算公式为

式中,n表示变量与变量的对应项数。

按上述计算公式计算的相关系数也称线性相关系数(Iinear correlation coefficient),或称Pearson相关系数(Pearson’s correlation coefficient)。

Excel中的统计函数(www.xing528.com)

使用Excel中的CORREL或PEARSON函数都可计算两组数据的相关系数。其语法为CORREL(Array1,Array2)。Array1和Array2是两个变量的数据区域。

【例8.2】 根据表8.1中的数据,计算不良贷款、各项贷款余额、累计应收贷款、贷款项目个数、固定资产投资额之间的相关系数。

解 用Excel计算的相关矩阵见表8.2。

表8.2 不良贷款、贷款余额、应收贷款、贷款项目个数、固定资产投资额之间的相关矩阵

用Excel计算各相关矩阵的操作步骤:

第1步:进入Excel表格界面,直接单击“工具”命令,下拉菜单选择“数据分析”。

第2步:在“数据分析”中,选择“相关系数”然后单击“确定”按钮,出现复选框。在对话框中,给定分析数据的“数据区域”,在输出区域内任选定单元格。此时,出现的界面如图8.6所示。

第3步:单击“确定”按钮,直接生成各变量之间的相关系数矩阵,见表8.2。

图8.6 Excel计算相关系数操作图

从相关矩阵可以看出,在不良贷款与其他几个变量中,与贷款余额的相关系数最大,r=0.84357136;而与固定资产投资额的相关系数最小,r=0.51851809。对比散点图8.2和图8.5,十分清楚地看出与计算得到的相关系数r结论是一致的。

在表8.2中,各个相关关系的数值说明了什么?为解释各数值的含义,首先需要对样本相关系数r的性质有所了解。相关系数r的性质可总结如下:

①r的取值范围在-1与+1之间,r>0表示正相关,r<0表示负相关;相关系数的绝对值越接近1,表示相关程度越高,越接近0,表示相关程度越弱;若|r|=1,则表示两个变量完全直线相关,若r=0,则表示两个变量之间不存在线性相关关系。

②r具有对称性。x与y之间的相关系数rxy和y与x之间的相关系数ryx相等,即rxy=ryx

③r仅仅描述x与y之间的线性关系,并不能用于描述非线性关系。当r=0时,只表示两个变量之间不存在线性相关关系,并不能说明变量之间没有任何关系。即不一定表示x与y之间就不存在其他非线性相关关系。

④r虽然是两个变量之间的线性关系的一个度量,却不意味着x与y一定有因果关系

为了判断线性相关关系的密切程度,可根据相关系数r的大小划分成不同的等级,如四级划分法:|r|≥0.8为高度线性相关;0.5≤|r|<0.8为中度线性相关;0.3≤|r|<0.5为低度线性相关,|r|<0.3时,说明两个变量之间的线性相关程度极弱。

【思考与分析】

从例8.2计算的相关系数结果来看,如何判断分析不良贷款与各个因素之间的线性相关关系的密切程度呢?请读者给出结论。

线性相关关系密切程度的判断与解释,必须建立在相关系数显著性检验的基础之上。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈