变异是普遍存在的现象,即使样本来自同质总体,它们彼此之间也会存在差异,这种差异就是变异。产生变异的原因是多方面的,诸如同一指标在不同个体之间,同一个体不同时间、不同测定方法之间、同一方法不同重复之间等都不可能完全一致。在科学研究中,这些差异通常以误差形式表现在实验中。误差可以分为系统误差、随机误差等。统计学上的误差指的是随机误差,包括抽样误差与重复测量误差,但通常主要指抽样误差。由于样本内各个体之间变异情况与总体内各个体变异情况不会完全相同。因此,样本指标与总体指标(如均数、比率)之间也必定不会完全相同,由此可见抽样误差是不可避免的。在科学研究中统计学设计的任务就是如何设法减少抽样误差。统计学检验的主要目的就是回答差异来自抽样误差的概率。
在一定条件下,并不总是出现相同结果的现象称为随机现象。在现实生产生活中,我们经常会遇到这样一类现象:在相同条件下多次进行同一实验或对同一现象进行多次观测,我们得到的结果却不总是相同的,往往存在一些差异,而且在每次实验或观测之前,不能确切预料会发生哪一种结果。这样的现象我们称之为随机现象。例如,检测一批同型号灯泡的使用寿命,有的灯泡能连续使用1000小时,有的却只能用600小时。为什么在相同条件下实验或观测的结果却出现差异呢?这是因为除了我们能人为控制的基本影响因素以外,客观上还存在大量不断变化着的次要因素对实验的结果施加影响。所有这些次要因素的作用都是随机出现的,这就造成了随机现象的结果是不可预测的。
随机变量(random variable)表示随机实验各种结果的实值单值函数。例如,某一时间内公共汽车站等车乘客人数,每次投掷骰子出现的点数等,都是随机变量的实例。一个随机实验可能结果(称为基本事件)的全体组成一个基本空间Ω。随机变量X是定义基本空间Ω上的取值为实数的函数,即基本空间Ω中每一个点,也就是每个基本事件都有实轴上的点与之对应。例如,掷一颗骰子,它的所有可能结果是出现1点、2点、3点、4点、5点和6点,若定义X为掷一颗骰子时出现的点数,则X为一随机变量,出现1,2,3,4,5,6点时X分别取值1,2,3,4,5,6。
根据随机变量的性质可以分为两类。(www.xing528.com)
●离散型随机变量:随机变量取值离散,只能取离散且有限个可列的数值。例如,掷一颗骰子,只能取1,2,3,4,5,6等6个自然数,不可能取到3.5这个数字的值;一个人的年龄,只能取0~150岁的可列数值;汽车厂一年生产的汽车数目,只能是从0到某个可数的自然数范围内。常见的离散型随机变量包括以下几种:0~1分布(也叫两点分布或伯努利分布)、二项分布、几何分布、泊松分布、超几何分布。
●连续型随机变量:如果随机变量可以在某个区间内取任一实数,且该区间内的实数数目趋于无限个,则称变量的取值是连续的,称为连续性随机变量。例如,统计一块田中小麦的生长高度,高度取值范围可以从[20,100]cm,在这个范围内的小麦生长高度都是可以取到的;统计18岁以上男子的身高,取值范围从[100,240]cm,在这个范围内的每个实数都可以取到,也称作连续性随机变量。常见的连续型随机变量包括以下几种:均匀分布、指数分布、正态分布。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。