首页 理论教育 统计分析的内容和方法

统计分析的内容和方法

时间:2023-11-20 理论教育 版权反馈
【摘要】:统计分析的主要内容包括数据汇总、统计分组、集中趋势、离散趋势、回归分析、相关分析、总体参数估计、假设验证等。为实现上述工作的方法就是统计分析方法。相关分析是对现象之间相互关系的方向和程度进行分析。在移民监测评估中,移民的家庭结构、房屋面积、粮食产量、收入及构成、就业及构成等指标均可以采用统计分析方法来得出结论。

统计分析的内容和方法

统计分析的主要内容包括数据汇总、统计分组、集中趋势、离散趋势、回归分析、相关分析、总体参数估计、假设验证等。为实现上述工作的方法就是统计分析方法。

1.集中趋势分析

集中趋势是指一组数据向某一个典型值或代表值集中的情况。如“大部分移民农村移民”、“农村移民年人均纯收入最高的3000元、最低的800元”等。集中趋势的概念就是代表值、平均值的概念,代表集中趋势的统计值主要有:平均数、中位数、众数。

集中趋势的意义在于:一是说明社会现象在一定历史条件下的共同性质。如用家庭平均人数说明家庭结构的一般性质。二是对社会现象的特征能够从数量方面在空间上进行比较。如同一项目不同地区家庭户平均人数不同,说明不同地区家庭观念可能不同。三是对社会现象的特征能够从数量方面在时间上进行比较。四是分析社会现象之间的相互依存关系。如生活水平的高低与家庭人口数的多少成反方向变化。

2.离散趋势分析

离散趋势是与集中趋势相对应的次数分布的特征。离散程度值越大,集中趋势值的代表性越小;离散程度值越小,集中趋势值的代表性越大。代表数据分布的离散程度的统计值主要有:全距、异众比率、四分位数、标准差等。

3.相关分析

说明客观事物相互间关系的密切程度并用适当的统计指标表示出来,这个过程就是相关分析。值得注意,事物之间有相关,不一定是因果关系,也可能仅是伴随关系。但如果事物之间有因果关系,则两者必然相关。相关关系是指现象之间确实存在的,但关系数值不固定的相互依存关系。相关关系按相关的程度不同可分为完全相关,不完全相关和不相关。完全相关即函数关系。不相关指两个变量之间毫无数量对应关系。不完全相关指介于完全相关与不相关之间的一种相关关系,大多数的相关关系都属于此类。相关关系按相关的方向不同可分为正相关负相关。当自变量增加(或减少)时,因变量也随之增加(或减少),称之为正相关。如农产品产量的收入等。如果自变量增加(或减少),因变量的数值则相应地减少(或增加),称为负相关。如劳动生产率提高,成本降低。相关关系按相关的形式不同可分为直线相关和曲线相关。自变量与对应的因变量在坐标图上描绘出来,大致是一条直线,则称为直线相关或线性相关。当自变量与因变量在坐标图上近似地表现为曲线(如抛物线双曲线、指数曲线),则称为曲线相关。相关关系按相关因素的多少不同,可分为单相关和复相关。若只涉及一个自变量和一个因变量则称为单相关。如收入与储蓄。若涉及一个因变量但两个或两个以上自变量则称为复相关。如劳动生产率、成本和利润之间的关系。

相关分析是对现象之间相互关系的方向和程度进行分析。

在水口水电站工程移民监测评估中,对524样本户5年(搬迁前一年、1992年、1993年、1994年、1995年)资料的进行相关分析计算,样本户家庭人均纯收入与家庭劳力人数、承包耕地面积、种植的果树地、从事非农业生产经营的劳力人数的相关系数分别为:0.19898、-0.13491、0.04692、0.35639。说明在上述各与收入有关的因子中移民家庭收入与家庭中从事非农业生产经营的劳力人数的关系最为密切。因此,在监测评估报告中,建议:“在重建的移民生产系统的完善过程及移民后期扶持中,应重点为移民创造更多的非农业就业机会”。(www.xing528.com)

4.回归分析

回归分析是指在相关分析的基础上,根据相关关系的数量表达式(回归方程式)与给定的自变量x,揭示因变量y在数量上的平均变化,并求得因变量的预测值的统计分析方法。回归分析按自变量的个数分,可分为一元回归和多元回归;按回归曲线的形态分,可分为线性回归和非线性回归。在移民监测评估中,一般使用一元线性回归分析。

5.总体参数估计

总体参数估计根据样本的数字特征推断总体的相应的数字特征,它又有点估计和区间估计之分。用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计。以样本统计量的抽样分布为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。

6.假设验证

利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称为假设检验。统计假设检验是推理统计中一类方法的总称,其目的是在没有总体数据的条件下对总体参数作出判断。在许多研究中,首先需要提出一个假设,这一假设合理或者正确与否,需要抽取样本用其统计量进行检验。通常根据总体是否从正态分布,将其分为参数检验非参数检验,前者如Z检验,t检验,X 2检验,方差分析等;后者有中数检验,符号检验,符号秩次检验,U检验,秩次方差分析等。

假设检验就是一种带有概率值保证的反证法。反证法是一种熟知的逻辑推理证明方法。有些命题从正面进行推论难以证明,而从反面去进行论证,也就是去证明它的否命题的荒谬性却往往事半功倍,这就是反证法的思想方法。这样做的理由是从逻辑上说,否命题不成立,则原命题就自然成立。统计假设检验从逻辑过程看也是一种反证法。统计检验者常常希望证明备择假设是正确的,但却不直接证明备择假设的正确性,而是从备择假设的对立的虚无假设出发,以虚无假设为条件,采集样本数据,确定抽样分布,计算统计量,考察检验统计量取值的概率,如果发现这是一小概率事件,那就要根据小概率事件原理推翻虚无假设。我们知道,根据小概率事件原理作决策判断是一种科学的决策方法,但不保证每次决策都是正确的。换句话说,推翻虚无假设的决策也是可能犯错误的,只是犯错误的概率比较小而决策正确的概率比较大,而且这个决策正确的概率是由我们控制,是可以计算的。我们通常把犯错误的概率称为“显著性水平”。可见,显著性水平越高,越不容易拒绝虚无假设,推断的可靠性越大;显著性水平越低,越容易拒绝虚无假设,推断的可靠性越小。

如将拒绝性概率分置于理论抽样分布的两侧,称为双侧检验,如将拒绝性概率分置于理论抽样分布的一侧,称为单侧检验。

在移民监测评估中,移民的家庭结构、房屋面积、粮食产量、收入及构成、就业及构成等指标均可以采用统计分析方法来得出结论。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈