首页 理论教育 统计偏差及其在绝缘测试中的应用

统计偏差及其在绝缘测试中的应用

时间:2023-06-29 理论教育 版权反馈
【摘要】:例如,一种绝缘的击穿电压平均值是9.2kV,从9.0~9.4kV区间内具有95%的置信区间。这表明置信上下限分别为9.4和9.0。于是,在式(2.4)和式(2.5)中使用术语的表达式为xi=logyi (2.6)式中,yi为某试验的单一结果。一旦转换完,即可用式(2.4)和式(2.6)计算对数均值和对数标准差的估计值。如果每一种绝缘结构寿命均值的置信区间有交叠,则不能证明两种绝缘有显著差异。

统计偏差及其在绝缘测试中的应用

如果用某种绝缘结构制作了几个样本进行高压加速老化试验,通常绝缘寿命十有八九都有差异。就是说,假设第一个样本在100h后发生故障,第10个样本也许能幸存1000h。即使所有的试验中样本完全相同,电压也精确一致,这种情况依然发生。结果的巨大差异是老化试验的典型特征。应力机械应力下的加速老化试验,发生故障的时间变化范围也很大。这类似于人类的情况,健康的20岁个体可能再活0~80年或更多。

当试验结果偏差很大时,需要用统计学方法分析试验结果。统计学分析有助于确认待评结构和基准结构之间是否有真正的差异,或者某个结果是否仅仅是正常波动。例如,在高温下测试不同材料制成的两个绝缘模型,其中一个耐受时间是另一个的2倍,那么耐受时间长的模型是否更好?或者这不过是正常的统计波动?而且,如果测得一个试验样本在中等温度下的寿命,而测得另一样本在高温下的寿命,能否预测第三个样本在第三种(可能更低的)温度下的寿命?

人们开发出的统计方法有助于回答此类问题。统计方法,一方面用统计分布,也被称为概率分布来量化试验结果中的正常偏差;另一方面,基于某一些应力水平下的老化试验,推导出一个公式,用来预测在另一个不同应力水平下的结果,这称作回归,或更通俗一些称作曲线拟合。这两个方面都是统计学教科书中的主题。下面简单复习一下这两个主题,并讨论与绝缘试验相关的术语和方法。读者可以参考任何标准教科书上的相关科目,例如本章参考文献[21]。

统计分布 大多数工程师和科学家均熟悉正态概率分布,有时也称作高斯分布。该分布可计算一系列试验结果的平均数μ、标准差σ以及置信区间。假设正态分布能基本表征试验结果的分布,只要测得两个或更多的试验结果,均值和标准差这两个数就能概括所有采集到的数据。均值是一个最可能出现的结果,标准差则是测得的可能偏离的数值。例如,美国25美分硬币的重量变化非常小,而人体重量的变化范围却非常大,即使他们性别年龄都相同。无论被测对象是何物,测量结果的偏差就像平均值一样,是其固有的特性。

要想知道真实的均值和标准差是不可能的,因为这需要采集无穷多的数据量。但我们可以估计一个数据集合的均值和标准偏差。对正态分布的数据,可通过计算平均数978-7-111-54303-9-Chapter02-1.jpg来估计均值:

978-7-111-54303-9-Chapter02-2.jpg

式中,xi是单次测量结果;N是被试样本的数量。标准差用s估算,即

978-7-111-54303-9-Chapter02-3.jpg

978-7-111-54303-9-Chapter02-4.jpgs均是对真实均值和标准差的估计值。被测样本越多,978-7-111-54303-9-Chapter02-5.jpgs越接近真实的均值和标准差。因为978-7-111-54303-9-Chapter02-6.jpgs不是真正的μσ,所以统计学家开发出了计算置信区间的方法,也就是设定一个(通常比较高)的概率,在978-7-111-54303-9-Chapter02-7.jpgs附近的某一范围内,μσ可能会以这个概率落在这个范围之内。例如,一种绝缘的击穿电压平均值是9.2kV,从9.0~9.4kV区间内具有95%的置信区间。这表明置信上下限分别为9.4和9.0。而95%的区间表示,如果同样数量的样本(比如说10个绝缘样本)重复试验,计算每组10个样本的978-7-111-54303-9-Chapter02-8.jpgss会落在置信上下限之内的次数会占到总次数的95%。因此置信限制值反映了978-7-111-54303-9-Chapter02-9.jpgs估计值的不确定性。计算正态分布数据置信区间的方法,在所有的统计学教科书中均有描述[21]。然而,一般而言,置信区间的宽度(即不确定性)随着测试样本数量N的二次方根而减少。

虽然正态分布广泛适用于大量的物理特性,但这种分布似乎并不适合绝缘寿命数据或者物理强度数据,如电气击穿强度或者机械抗拉强度。对于寿命和强度数据,对数正态分布和威布尔概率分布更为常用[22,23]

终检 在讨论最常用于绝缘老化试验的分布前,还有另一个有关此类试验的重要统计学现象——终检。在许多老化试验中,大多数样本在一个合理的时间内出现故障,然而极少数样本常常似乎一直会“存活”下去;对测试人员来说,这令人沮丧。以前所述的用于估计均值和标准差的方程式,取决于所有的被试样本均会发生故障。也就是说,数据必须完全适用。无论如何,当有些样本仍然没有发生故障时,已经有方法来估计分布参数(如978-7-111-54303-9-Chapter02-10.jpgs)。一个试验执行时,对某些样本在发生故障前做出分布参数估计,即称为终检试验。有若干种不同类型的终检,取决于试验何时结束——或者是达到样本数量定额,或者是达到试验时间定额(或电压或抗拉强度)即结束试验。关于终检的详细介绍,在大多数高级统计学方法的书中都有描述,如本章参考文献[22]。

对于老化试验所用的最普遍的概率分布,已经有了用终检过的数据来估计参数的方法。样本故障的百分数越高,则参数的置信区间越窄,这看起来合理。

对数正态分布 对数正态分布是正态分布的简单变换,其中以绝缘寿命的对数作为变量。这种分布几乎专门用于分析以温度为加速应力的加速老化试验的结果,并且温度是绝缘热分级的关键因素。对数正态分布有时也用于击穿电压和抗拉强度试验。IEEE 930(也被称作IEC 62539)[6]给出了计算对数正态分布的对数均值、对数标准差,以及计算参数置信区间的一般原则。对数正态分布在热老化试验上的应用可参阅本章参考文献[23~25]。

不是直接用故障时间或者故障电压,而是把电压、时间等参数首先取对数。于是,在式(2.4)和式(2.5)中使用术语的表达式为

xi=logyi (2.6)

式中,yi为某试验的单一结果(故障时间,击穿电压等)。只要参数是一致的,要么用自然对数,要么用以10为底的常用对数。一旦转换完,即可用式(2.4)和式(2.6)计算对数均值和对数标准差的估计值。参数估计则可通过反对数转换成通常的工程单位。参数估计的置信区间,可以通过Student-t分布表和Χ2(卡方)分布表很容易进行计算,这两种分布表在所有统计学教科书中都可以找到。

如果对两种绝缘做热加速老化试验,那么人们常常会问,两种绝缘是否性能相同,或者是否一种绝缘具有更好的热性能。也就是说,它在相同温度下持续了更长的时间,或在更高温度下持续了相同时间。如果每一种绝缘结构寿命均值的置信区间有交叠,则不能证明两种绝缘有显著差异。然而,如果置信区间不交叠,则某种绝缘类型(故障前时间的平均值更长者)更好。可用t检验和F检验严格分析绝缘之间的差异,在给定试验结果的自然偏差情况下,这两种检验得出的两种绝缘之间的差异,具有一定(高)水平的可信度[21]。IEEE 101和IEC60216[25]给出了很多用统计学方法确定热老化试验下优秀绝缘材料的实例。(www.xing528.com)

如果数据被终检通过,则对数正态分布分析会比较困难。如果所有试验样本均未出现故障,没有现成的简单公式或图表帮助试验人员计算对数均值和对数标准差。因此,事实上所有热老化试验都假定所有样本均被测试至故障。不过,本章参考文献[24]中的某些表格能用于某些终检情况。此外,有些功能非常强大的计算机程序也可以计算终检数据的对数正态参数和置信区间。虽然目前可用的程序包很多,但已展示出其具有效性的是SAS研究所的SAS/STAT个人计算机软件[26]

威布尔分布 威布尔分布广泛应用于电压耐受试验数据分析,即绝缘样本施加恒定的交流电压或脉冲电压,并测量直至故障一刻的持续时间。该分布也应用于测量绝缘击穿电压的试验。威布尔分布是一类被称作极值分布中的一员[22]。原则上说,在由“薄弱环节”故障引起的完全绝缘击穿场合,这种分布最合适。因为绝缘会在最薄弱或最大缺陷处击穿,所以看起来薄弱环节模型较为适用。

两参数威布尔分布函数的累计分布函数如下:

978-7-111-54303-9-Chapter02-11.jpg

式中,Ft)是经时间t后样本发生故障的概率;α称作比例参数,与t的单位一致。α越大,无故障时间越长,如α对应于试验中63.2%的样本至故障一刻的持续时间。β是“形状”参数,它是数据延伸范围的测量值,β越大,故障时间(或电压)的范围越小。因此,它正比于标准差的倒数。通常对于耐压试验,β近似在1~2之间;而在测量击穿电压时常常取10左右。

还有一种替代形式的威布尔分布被称作三参数威布尔分布[22],这种分布形式考虑了最短的至故障一刻的可能时间或最小的故障电压。但这种形式的分布很少用于旋转电机绝缘结构。

虽然没有计算αβ估计值的简单公式,但有一种简单计算机程序,用最大似然估计方法计算出其估计值[6]。还有一些简单的图表,可用于在参数估计时计算大致的置信区间[6]。有许多商用计算机程序也可用来计算参数和置信区间,如上面提及的SAS/STAT程序。类似前面讨论的对数正态分布,人们很容易就可以通过确认α的置信区间是否交叠来确认两个绝缘样本是否差异显著。如果有交叠,则不能肯定有显著差异,或者不能确认两种不同绝缘的比例参数之间的差异是否仅仅源于自然偏差。

威布尔分布普及的原因之一是因为终检数据很容易得到分析。IEEE 930(也被称为IEC 62539)[6]给出了这种方法。类似地,大多数现代统计学程序都易于适应终检数据,包括计算置信区间和进行假设检验来决定两绝缘结构是否有显著差异。

回归分析 除允许判定两类绝缘是否显著不同外(一种比较试验),统计学方法也能预测绝缘结构在某一不同于试验温度或试验电压时的性能表现。这种计算过程叫作回归分析,也被称为曲线拟合。这项内容在所有基础统计学教科书中都是标准的章节[21]。这些原理的大部分都可用于绝缘加速老化试验。

举个例子,某个绝缘结构在两个或多个温度下试验,通常试验温度高于运行温度。如F级绝缘材料,在温度为155℃(见第2.3节)时,平均期望生存20000h。对应约为2.3年的寿命。这个时间对于等待得出试验结果来说太长了。因此取更高的温度进行试验,也许是175℃、195℃或205℃。这会显著缩短故障前时间[回顾式(2.1),温度对绝缘寿命影响非常大]。通过每一组多个样本在三个温度下至故障前的时间,可用回归分析来定义一个方程式,描述至故障的时间与温度的关系。进而,该方程式能用来预测一个较低温度下的故障发生时间,比如155℃。图2.1所示为某种绝缘材料寿命对温度的曲线,摘自IEEE 1。

对于正态分布数据或者能转化为正态分布的数据(例如用对数正态分布表达的热寿命数据),可以很容易建立起回归过程。所有统计学教科书都会概述这个过程。本章参考文献[23]和[25]给出了适用于热老化试验数据的回归分析过程的例子。注意,这两个标准均假定式(2.1)是有效的(也就是说,仅限定单一化学反应导致热劣化),并且所有的样本均试验至故障。对于其他情景下的回归过程通常是不适用的。

威布尔分布数据的回归分析,从原理上说是与对数正态分布一样的,不过,还有一些复杂的因素需要考虑。因为线性回归的假设基础是指发生故障时间呈正态分布或者可以被转化为正态分布,因此用于线性回归的常用分析过程就不能直接用于威布尔分布数据[27]。实际上,许多人忽视了这种限制,或是假设数据符合对数正态分布,而实施常见的回归分析。作为替代选择,本章参考文献[22]中介绍了对呈威布尔分布数据进行严格回归分析的方法。因为大多数工程师发觉后一种方法实施难度大,故采用各种统计学程序如SAS/STAT软件包进行计算、推导方程,以及对推导出的方程计算置信界限。

样本数量 因为老化试验结果的统计范围变化非常大,就引发了这样一个疑问,即究竟需要测试多少个样本,才能确定一种新的绝缘材料或绝缘结构是否等同于或优于基准材料/结构。测试样本越多,就越容易检测出是否存在显著差异。令人无奈的是,这样去取得测试结果需要花费大量金钱和时间。所以,人们强烈希望尽可能减少测试的样本数。

电老化或者热老化试验的发生故障时间,变化范围远大于抗拉强度或者击穿电压测量。由此导致恒应力老化试验比渐进应力老化试验需要更多样本。基于热老化试验中预期正态方差,很多关键性的IEEE和IEC标准(见第2.3节)都给出了在每一温度下被试样本数量的推荐值。典型的推荐值是5。但对于电压耐受试验,大家则莫衷一是[28]。为检定出一种寿命比基准材料提高2倍的新材料,每种材料均需要取10个样本用于试验。事实上,经常是测试样本比较少,导致试验结果的分析出现争议。

978-7-111-54303-9-Chapter02-12.jpg

图2.1 B级(130级)材料典型的热耐受曲线。注意对应20000h寿命的温度(引自1989 IEEE,版权所有)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈