首页 理论教育 统计学中的基本概念及其应用

统计学中的基本概念及其应用

时间:2023-07-18 理论教育 版权反馈
【摘要】:根据误差产生的原因可分为系统误差、随机误差和抽样误差。系统误差是人为因素造成的,可通过严密的设计和规范准确的操作来尽量避免。只要是抽样研究,抽样误差就不可避免,但有一定的规律,可以运用统计学方法将其控制在允许范围内。统计学上常将P≤0.05或P≤0.01的事件称为小概率事件,即在实际一次观测中不会出现的事件。

统计学中的基本概念及其应用

一、变量与变量值

变量(variable)是指研究中观察单位的某种特征,亦可称为观察指标。如一个儿童的特征有性别、年龄、身高、体重等,一个地区的特征有人口量、经济情况、教育普及率等。变量是由变量名(variable name)和变量值(value of value)构成的,如性别是变量名,其变量值为男或女;体重是变量名,其变量值有50 kg、60 kg等。

二、同质与变异

同质(homogeneity)是指观察单位(研究的个体)之间对研究指标的影响因素相同。同质的个体间各种指标的观察值参差不齐,存在差异,这种差异称为变异(variation)。如研究成年人血压的现患情况,选取同一个社区、同年龄段、同性别的人群即为同质的人群。由于导致高血压的原因复杂,即使是同质的人群,其血压值也各不相同,此即个体变异。

三、总体与样本

总体(population)是根据研究目的所确定的同质的观察单位的全体,更确切地说,是同质的所有观察单位某种观察值的集合。观察单位是研究的最基本单位,又称个体(individual)。样本(sample)是根据随机化(randomization)原则从总体中抽取的部分有代表性的个体。该样本所包含的个体数目,称为样本含量(sample size)或样本大小。

例如,要了解某市10岁小学生的肥胖情况,其观察对象是该地当年所有10岁小学生,其同质的条件为同一市、同为10岁;观察单位是指该地该年的每一个10岁学生,该地该年全体10岁学生的肥胖情况就构成了此次研究的总体。这里的总体只包括有限的观察单位(特定的时间、空间范围内),称为有限总体(finite population)。有时总体是设想的,无特定时间和空间的限制,因此观察单位是无限的,称为无限总体(infinite population)。

总体包含的观察单位通常是大量的,在实际工作中,通常从总体中随机抽取一定数量的样本加以观察或研究,然后从这一部分个体的情况去推断总体的状况。

四、参数与统计量

总体的统计指标称为参数,样本的统计指标称为统计量。如研究某年某地区55岁以上男性高血压的患病情况,该地所有55岁以上男性高血压患病率即为总体参数。若用随机方法从该地抽取一部分55岁以上男性,调查其患病情况,计算的患病率即为统计量。(www.xing528.com)

五、误差

误差是指测量值与真实值之间的差异。根据误差产生的原因可分为系统误差随机误差抽样误差

(1)系统误差是指在研究工作中,由于设计的缺陷或仪器未校准等原因,使结果倾向性地偏大或偏小。系统误差是人为因素造成的,可通过严密的设计和规范准确的操作来尽量避免。

(2)随机误差是指在研究条件严格控制的情况下,由于偶然的影响,对同一对象多次测量所得结果也不完全一致。随机误差没有固定的方向,有时偏大,有时偏小,也不可避免,但可用多次测量求平均值的方法将其控制在允许的范围内。

(3)抽样误差是指在抽样研究中,即使消除了系统误差,将随机测量误差控制在允许范围,由于个体差异的存在,样本指标与总体指标之间仍会存在差异。只要是抽样研究,抽样误差就不可避免,但有一定的规律,可以运用统计学方法将其控制在允许范围内。

随机抽样方法

六、概率与小概率事件

概率(probability)是某事件发生机会的大小。统计学上用符号P表示,其范围在0~1之间。P=1的事件为必然事件,表明该事件一定会发生;P=0的事件称为不可能事件,表明该事件一定不会发生;0<P<1的事件为随机事件,P越接近于1表示该事件发生的概率越大;P越接近于0表示该事件发生的概率越小。统计学上常将P≤0.05或P≤0.01的事件称为小概率事件,即在实际一次观测中不会出现的事件。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈