首页 理论教育 协方差及协方差矩阵应用于生命科学基础研究入门中的相关分析

协方差及协方差矩阵应用于生命科学基础研究入门中的相关分析

时间:2023-10-30 理论教育 版权反馈
【摘要】:相关分析是研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法。例如,人的身高和体重之间、空气中的相对湿度与降雨量之间,都是相关分析研究的问题。(一)协方差及协方差矩阵一种相关分析方法是计算协方差。

协方差及协方差矩阵应用于生命科学基础研究入门中的相关分析

相关分析是研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法。例如,人的身高和体重之间、空气中的相对湿度降雨量之间,都是相关分析研究的问题。相关分析与回归分析之间的区别:回归分析侧重于研究随机变量间的依赖关系,以便用一个变量去预测另一个变量;相关分析侧重于发现随机变量间的种种相关特性。相关分析在工农业、水文、气象、社会经济和生物学等方面都有所应用。

(一)协方差及协方差矩阵

一种相关分析方法是计算协方差。协方差是用来衡量两个变量的总体误差的,如果两个变量的变化趋势一致,协方差就是正值,说明两个变量正相关。如果两个变量的变化趋势相反,协方差就是负值,说明两个变量负相关。如果两个变量相互独立,那么协方差就是0,说明两个变量不相关。

协方差公式:

协方差只能对两组数据进行相关性分析,当有两组以上数据时就需要使用协方差矩阵。下面是三组数据x,y,z,的协方差矩阵计算公式。

协方差矩阵公式:

协方差通过数字衡量变量间的相关性,正值表示正相关,负值表示负相关。但它无法对相关的密切程度进行度量。当我们面对多个变量时,无法通过协方差来说明哪两组数据的相关性最高。要衡量和对比相关性的密切程度,就需要使用下一个方法:相关系数

(二)相关系数(www.xing528.com)

相关系数(Correlation coefficient)是反映变量之间关系密切程度的统计指标,相关系数的取值区间为1~-1。1表示两个变量完全线性相关,-1表示两个变量完全负相关,0表示两个变量不相关。数据越趋近于0表示相关关系越弱。以下是相关系数的计算公式。

相关系数公式:

其中rxy表示样本相关系数,Sxy表示样本协方差,Sx表示X的样本标准差,Sy表示Y的样本标准差。下面分别是Sxy协方差和Sx和Sy标准差的计算公式。由于是样本协方差和样本标准差,因此分母使用的是n-1。

Sxy样本协方差计算公式:

Sx样本标准差计算公式:

Sy样本标准差计算公式:

注:R中相关分析可通过cor()函数实现,其详细运用见https://stat.ethz.ch/R-manual/R-devel/library/stats/html/cor.html或help(“”)命令调用的帮助文档。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈