含有粗大误差的测量值(称为异常值或坏值)必然导致测量结果的失真,从而使测量结果失去可靠性和使用价值,数据处理时应设法从测量数据中剔除;另一方面,测量数据含有随机误差和系统误差是正常现象,通常测量值具有一定程度的分散性,因此不能随意地将少数看起来误差较大的测量值作为异常值剔除,否则,所得结果是虚假的。因此,建立一些法则来判断实验数据的合理性是必要的,通常粗大误差的判别方法分为以下两种。
1)物理判别法
在测量过程中,及时分析和研究测量的各环节,若发现某数据明显不符合物理规律,找出造成粗大误差的原因,并将含有粗大误差的数据及时剔除。这种通过直观分析、研究各测量环节来消除异常值的方法称为物理判别法。比如:单摆实验中,可由所测数据大致估计出每摆动一次所用时间,如果几次测量的时间中,有一个与其他值的差大于摆动一次所用的时间,这就意味着把摆动次数数错了,这个数据应剔除。
2)统计判别法(www.xing528.com)
对于不明显的粗大误差,在测量中难以发觉,可在测量结束后,对所有的测量数据用统计的方法进行判别检验。
统计判别法的基本思想是:在无系统误差的前提下,根据随机误差的统计规律,建立一个统计量,给定置信概率(或显著水平),确定出该统计量的界限,凡是超过这个界限的误差,就认为不属于随机误差范畴,而是粗大误差,相应的测量值为异常值,应剔除。如此反复,直至没有异常值。例如,莱以达准则中,对测量次数超过10的一测量列x1,x2,…,xn,以极限误差±3σ作为判断标准,并根据公式(1.13)计算出它的估计值±3S。按照正态分布随机误差的特点,在有限次测量中,超出该极限误差的数据不会出现,如果出现则视为坏值,因此可以检验每一个测量值的残差,若>3S,则可以确定xi为坏值予以剔除。对剔除坏值后的测量列数据再重复进行判断,直到无坏值为止。除此之外,肖维勒准则、格拉布斯准则等,也都是常用的判别粗大误差的方法,在此不做详细介绍。
需要注意,若应用统计判别法判断出的异常值过多,应对样本的代表性进行检验,确认假设的统计分布规律是否合理,所采用的方法条件是否满足。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。