【摘要】:将一组数据从小到大排列为x1,x2,…,xn,其中x1或xn为可疑值,计算x- 和s,然后按下式计算统计量T:如果T计>T表,则可疑值为异常值,应舍弃,否则应保留。由于Grubbs法利用了样本的两个重要的统计量 和s,故比较合理,可靠性也较高,是三种方法中最优的。Q 检验法居中,法可靠性最差。总之,必须慎重对待测量过程中的异常值处理问题。因此对于异常值的取舍有时必须根据具体情况而定。
将一组数据从小到大排列为x1,x2,… ,xn,其中x1或xn为可疑值,计算x- 和s,然后按下式计算统计量T:
如果T计>T表(即表3-5所列Tα,n值),则可疑值为异常值,应舍弃,否则应保留。
表3-5 Tα,n值表
(www.xing528.com)
以上三种方法的依据不同,对同一组数据的可疑值检验的结果可能不一样。由于Grubbs法利用了样本的两个重要的统计量 和s,故比较合理,可靠性也较高,是三种方法中最优的。Q 检验法居中,法可靠性最差。
总之,必须慎重对待测量过程中的异常值处理问题。从统计的角度看,用不同的检验方法检验同一组测量值,有时会得出不一样的检验结果。异常值有时很有可能是实验过程中出现了某种还不为人们所知的新现象。如果随意舍弃了这些异常值,也许会失去发现新现象的机会。因此对于异常值的取舍有时必须根据具体情况而定。
如果所研究的对象相对来说是比较稳定的,则异常值的出现常常是技术上的原因所造成的;而如果所研究的对象本身就是不稳定的,则异常值也应保留,并做进一步分析以期得到更多的信息。例如,在大气中有害成分的分析中,样品随时间和空间的变化非常大,异常值的出现恰恰真实地反映了这种变化,应将这些异常值保留,并深入研究,很可能会发现污染的变化趋势和规律。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。