首页 理论教育 应用统计学:基本术语

应用统计学:基本术语

时间:2023-08-12 理论教育 版权反馈
【摘要】:统计总体、总体单位与样本1)统计总体统计总体简称总体,指研究对象的全体,是把客观存在的许多个别事物在同一性质基础上结合起来的整体。统计数据信息资料的承担者是总体单位,统计资料的搜集是对总体单位特征进行调查。图0.1总体、样本、总体参数、样本统计量概念示意图统计标志、统计指标与指标体系1)统计标志统计标志简称标志,是说明总体单位的属性或特征的名称。总体单位是标志的承担者,标志是统计认识的起点。

应用统计学:基本术语

(1)统计总体、总体单位与样本

1)统计总体

统计总体(population)简称总体,指研究对象的全体,是把客观存在的许多个别事物在同一性质基础上结合起来的整体。例如,为了研究某一批次产品质量的好坏,被研究的“该批次产品的某个质量特性值”全体就是一个总体。总体中所包含的总体单位的数量称为总体容量(population size),常用符号N 表示。包含有无限个总体单位的总体称为无限总体,如森林病虫害、大气污染等是无限总体。包含有限个总体单位的总体称为有限总体,如某地区在某时点的人口数量就是有限总体。

总体有大量性、变异性、同质性和相对性四个性质。大量性是指总体内包含的总体单位有许许多多。变异性是指构成总体的各个总体单位之间互有差异。如高校为总体时,各个高校的所有制形式、高校规模、办学特色等方面都有差异。同质性是指构成总体的各个总体单位之间虽互有差异,但至少具备一种共同的性质。例如,研究某高校全体学生的“统计学”成绩,则全校所有的学生就构成了统计总体,每一名学生均在该校注册这一共同性构成了这个总体的前提条件。统计学中的定义强调数据所依附的载体,成绩是学生取得的,成绩所依附的载体是学生,故这里统计总体是全体学生,而不是所有的“统计学”成绩。这样定义的原因是以社会、经济、自然等数量方面为研究对象的统计学,把处理分析问题作为自己的重心。如果研究学生的状态,则不仅仅是“统计学”成绩一项,需要用一系列的数据来反映学生状态,这时这种总体的定义就显示出了其优越性。同质性是总体的前提,而变异性则是统计的前提。相对性是指总体与总体单位是相对于统计研究目的而言的,随着研究任务的改变而改变。同一单位可以是总体也可以是总体单位。例如,要了解全国工业企业职工的工资收入情况,那么全部工厂是总体,各个工厂是总体单位。如果旨在了解某个企业职工的工资收入情况,则该企业就成了总体,每位职工的工资就是总体单位了。

2)总体单位

构成总体的个别事物称为总体单位(item unit),也称个体。统计数据信息资料的承担者是总体单位,统计资料的搜集是对总体单位特征进行调查。例如,在研究高校全体学生的“统计学”成绩时,该校的每一名学生便是总体单位。对于不同的研究对象,总体单位可能是人、物,也可能是企业、机构,甚至可能是时间、地域等。

总体与总体单位是整体与局部的关系。总体是统计研究对象的全部,是由具有相同性的总体单位构成,总体单位是构成总体的元素。

3)样本

样本(sample)是由从总体中抽取的部分个体组成的集合,用以代表总体。抽取样本的目的是用来推断总体,因此要求样本能够对总体具有足够的代表性。样本代表总体的程度越高,由样本计算的统计量与总体指标的误差就越小。

样本中所包含的个体数量称为样本容量(sample size)或样本大小,常用n 表示,n 一般是比较小的一个数。例如,我们想了解某一批次产品的合格率,那么就会随机选取100 件产品进行检验,这100 件产品就构成了一个样本,样本容量就是100。根据对这100 件产品检验的结果计算出样本的合格率,并用它来代表或者推断总体产品的合格率。一般用X1,X2,…,Xn表示总体的一个样本,样本数据的取值记为x1,x2,…,xn,称为样本观测值。理论上讲,样本容量1≤n≤N。

(2)总体参数与样本统计量

1)总体参数

总体参数(population parameter)是用来描述总体特征的概括性数字度量。通常有总体均值μ、总体方差σ2、总体比例p 等,总体参数是一个未知的常数。

2)样本统计量

样本统计量(sample statistic)是用来描述样本特征的概括性数字度量,简称统计量。通常有样本均值 、样本方差S2、样本比例 等。统计量是根据抽取的样本数据计算出来的值,它是样本的函数。

总体、样本、总体参数、样本统计量的概念可以用图0.1 来表示。

图0.1 总体、样本、总体参数、样本统计量概念示意图

(3)统计标志、统计指标与指标体系(www.xing528.com)

1)统计标志

统计标志(statistical character)简称标志,是说明总体单位的属性或特征的名称。例如,某个学生的姓名、性别、年级、年龄、考试成绩、月生活费用是标志;企业的所有制形式、企业规模、所属行业、产值等也是标志。标志是用来说明个体特征的概念。总体单位是标志的承担者,标志是统计认识的起点。

按总体单位性质不同分为品质标志和数量标志。品质标志是说明总体单位性质(属性)方面特征的名称,一般使用文字来表现,如某个学生的姓名、性别、年级等。数量标志是说明总体单位数量特征的名称,用数字来表现,由标志名称和标志值组成,如某个学生的年龄、身高、考试成绩等特征。

标志按标志值是否可变分为不变标志和可变标志。不变标志是指总体中各总体单位某一特征表现相同,如同一规格螺丝帽的内径都相同。可变标志又称变异标志,是指总体中某一标志在各总体单位的具体表现不尽相同,随总体单位不同而标志取值表现也不同,如从同一棵苹果树上所摘下的苹果的重量不尽相同。不变的数量标志称为常量或参数;可变的数量标志抽象化称为变量,其取值称为变量值或标志值。

2)统计指标

统计指标(statistical indicator)简称指标,是说明客观现象总体特征的概念及其数值,是数量标志的汇总。例如,国内生产总值、人口数量、耕地面积、财政收入等都称为统计指标。统计指标有两种使用方法:一是进行统计设计或理论研究时所使用的仅有数量概念而没有具体数字的统计指标;二是统计指标由指标名称和指标数值构成。

统计指标分为数量指标和质量指标:数量指标是反映现象总规模、总水平和工作总量的统计指标,也称为总量指标或统计绝对数;质量指标是反映现象相对水平或工作质量的统计指标,通常是由两个总量指标对比而派生的指标,用相对指标或平均指标来表示,反映现象之间的内在联系和对比关系。(详见第3章论述)

3)指标体系

指标体系(indicator system)是指由若干个相互联系的单一指标构成的指标群,用以说明总体的全面特征和总体内部构成之间的相互联系。例如,一个工业企业的生产经营活动是人力、物质资金、生产、供应销售相互联系的整体运作过程,以一群指标说明和分析企业的全面情况,就形成工业企业统计指标体系:销售利润=销售量×价格×利润率。按所研究问题的范围大小,指标体系大体分为基本指标体系和专题指标体系两大类。基本指标体系能反映社会生产和生活的全过程,其组成部分又可以分成经济、社会和科技三个子体系。专题指标体系是针对某一个社会经济研究课题而专门设计的指标体系,如经济效益指标体系、人民生活水平指标体系等。按其功能不同,统计指标体系可以分为描述统计指标体系、评价统计指标体系和预警统计指标体系。

(4)变量

变量(variable)是说明现象某种特征的概念,其取值称为变量值。变量可分为以下几种类型:

1)分类变量

分类变量的取值就是分类数据。例如,性别就是一个分类变量,其变量值为“男、女”两类数据。

2)顺序变量

顺序变量的取值就是顺序数据。例如,顾客满意度就是一个顺序变量,其变量值可以为“很满意、较满意、一般满意、较不满意、很不满意”这五个顺序数据。

3)数值型变量

数值型变量的取值是数量数据。根据其取值的不同,又可分为离散型变量和连续型变量。

①离散型变量,只能取有限个或可列无限多个,并且其取值都以整位数断开,如合格数、企业数等。

②连续型变量,可以在一个或多个区间中取任何值的变量,其取值是连续不断的,不能一一列举,如年龄、灯泡的寿命等。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈