但在一组分析数据中,往往有个别数据与其他数据相差较大,这种个别数据成为可疑值。对可疑值的处理,应首先回顾和检查生产可疑值的实验过程,有无可觉察到的技术上的异常原因。但原因不明时,必须按一定的数理统计方法进行处理,决定保留还是舍弃。统计学处理的方法有许多种,常用的有四倍法、Q检验法、迪克逊(Dixon)检验法和格鲁布斯(Grubbs)检验法。
经过业内长时间、多次实验比较,格鲁布斯检验方法的效果最好。
应用案例
在应用格鲁布斯检验法判断可疑值取舍的过程中,发现在置信水平相同时,在不同文献中有两种临界值表[2][3],我们在判断可疑值的取舍时应如何选用呢?
用重铬酸钾作基准试剂,对硫代硫酸钠溶液的浓度进行标定,共做了6次,测得其物质的量浓度c(Na2S2O3)=0.1025;0.1031;0.1028;0.1051;0.1021;0.1031mo1/L。用格鲁布斯检验法来判断可疑值0.1051是否应舍弃。
首先算得X平均=0.10315, S=0.00105 (均保留一位安全数字),可以数据的格鲁布斯G计:
这里要提出的是:一般有效数字修约规则为“四舍六人五留双”。但对标准偏差、格鲁布斯检验统计量等值按“只进不退”的修约规则。[2]
通常把置信水平定为95%。
格鲁布斯检验法的临界值表,
G0.95,6=1.82
G计(1.86)>G0.95,6 (1.82)
所以0.1051为异常值,应舍弃。
但查阅另一份文献格鲁布斯检验法的临界值表,
G0.95,6=1.89
G计(1.86)>G0.95,6(1.89)
这样0.1051为正常值, 应保留。
同样是格鲁布斯检验法,并且置信水平相同,查不同的文献得到不同的临界值,因此得到相反的结论。结论只可能是一个,在本案例中应该选用哪本文献上的临界值呢?
我们需要弄清两个概念:双尾检验和单尾检验
双尾检验:是指只要可疑值和标准值有显著差别,不论高于还是低于标准值,都应判断为异常值。即:可疑值可以是最大值,也可以是最小值,否定域处在正态分布的两侧。
单尾检验:是指可疑值和标准值有显著差别,只高于(或低于)标准值,都应判为异常值。其否定区域集中在正态分布的一头,如空白试验的可疑值只可能为比零稍大的一个数值。
从实验内容来看,案例中的可疑值判断属于双尾检验。故应选用双尾检验临界值。
G0.95,6(双尾)=1.89 或G0.05,6(双尾)=1.89
由于G计(1.86)<G0.95,6(1.89)故0.1051是正常值,应当保留。
由单尾检验和双尾检验的性质不难看出,由于单尾检验的否定域集中在一头,而双尾检验的的否定域集中在两侧,若把显著性水平确定为α=0.05,本案例是双尾检验,如使用单尾检验的临界值表,
同样可以得到正确的结论,但是在单尾检验的临界值表则查不到该值,因此不如直接查双尾检验的临界值表。
格鲁布斯检验法临界值表
单尾检验用表
双尾检验用表
小结
在使用格鲁布斯检验法时,必须正确地选用临界值,鉴于书中一般只有一种临界值表,在选用时应加以注意,以免发生错误。
经理人
展源
何发
2020-05-27
2024-02-21
2020-05-27
2022-09-30
2024-02-01
2020-05-27
2021-04-12
2023-02-03
2023-08-09
2024-03-08
加载更多