统计分析的基本任务是利用样本的试验结果推断总体参数的指标值。指标的估计就是根据从总体中抽得的样本所提供的信息,对总体分布中包含的未知参数作出数值上的估计,包括点估计(Point Estimate)和区间估计(Interval Estimate)。
装备试验很多时候是为了得到装备的某一性能参数,一般是通过多次试验,获得该参数对应的装备技术性能和使用性能的试验值,再用这些值来估计参数的准确值,这在统计学中称为参数的点估计问题。显然,估计的精度与试验次数(也就是样本量)有密切的关系。点估计又称为点值估计、定值估计。估计的过程为:首先根据总体参数的性质构造一个统计量,然后由样本数据计算出统计量的值,并直接作为相应的总体参数值的替代。
点估计是用来估计总体参数的一个统计值,但由于样本的抽取具有不确定性,所以造成点估计值也具有随机性,可能会有波动,这就是抽样误差。战术技术指标的统计推断是用样本数据推断总体指标,由于样本的随机性,推断的结论带有一定的不确定性,因此指标的估计通常采用数理统计中的区间估计方法。区间估计可以给出参数的一个波动范围,并且一般可以给出在该范围包含参数真值的概率。
在给定的样本容量下,从总体中抽取的样本组合可能有多种。这就使得通过样本估计参数进行点估计与区间估计时可能有多种不同的结果,而且每种估计的结果还可能不一致。如图4-5所示,θ为未知参数的真值,图4-5(a)中,(i=l,2,…,K,K表示可能的样本数,注意区别样本数与样本容量)表示根据第i个样本得出的θ的估计值,图4-5(b)中,表示根据第i个样本得出的θ的区间估计。
图4-5 点估计与区间估计示意
(a)类型一;(b)类型二
定义区间估计的置信水平(Confidence Level)1-α(有时也称为置信度)为含有被估计的参数的区间数占全部区间数的比例。定义置信区间(Confidence Interval)为具有特定的置信水平的一个区间估计。(www.xing528.com)
从置信区间的定义可见,置信区间描述了多次使用同一种方法构造参数的置信区间时,所构造的区间中包含未知参数真值在内的区间数所占的比率。单一次使用该区间,未知参数可能不包含于此区间之内,只能说在置信水平1-α下该区间包含未知参数的真值。进行区间估计的一般方法是先确定参数点估计的统计分布特性,然后再据此确定参数真值的波动范围。
当置信水平一定时,随着样本量的增加,置信区间会变小,所以对参数真值的估计将更为准确。但当样本量大到一定程度后,精度的提高将变慢,使试验成本增加。当样本量一定时,随着置信水平的加大,置信区间会变大,使得对参数的估计精度降低。
区间估计、置信区间估计的数学描述如下:
设θ为一维未知参数,为两个统计量,用区间去估计θ可能存在的范围,称为θ的一个区间估计。
设为θ的一个区间估计,若对给定的正数γ(γ=1-α)及θ的任一可能值θ′,有
则称为θ的一个置信水平是γ的置信下限(Confidence Lower Limit)和置信上限(Confidence Upper Limit):
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。