首页 理论教育 常用试验设计术语-试验设计与统计分析

常用试验设计术语-试验设计与统计分析

时间:2023-09-26 理论教育 版权反馈
【摘要】:试验设计中,应该尽量使非数量指标数量化。它们在一起构成了本试验的试验条件。因素对试验总效果是由每一因素对试验的单独作用再加上各个因素之间的联合作用决定的。试验设计中,一般仅适于可控因素。

常用试验设计术语-试验设计与统计分析

一、总体与样本

1.总体

统计学中,根据一定的研究目的和要求所确定的研究对象的全体称为总体(population);而把组成总体的每一个对象称为个体(individual)。例如,在研究某批酸乳的发酵情况时,该批酸乳的全体就组成了总体,而其中每一瓶酸乳就是一个个体。但对于具体问题,由于关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示酸乳的发酵情况。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于所关心的正是这个数量指标,因此就把总体和数量指标X可能取值的全体组成的集合等同起来。

对总体的研究,就是对相应的随机变量X的分布研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体(finite population)和无限总体(infi-nite population)。有限总体中观察单位数是有限的或可知的,而无限总体的观察单位数是无限的或不可知的。在实际工作中,对总体特征与性质的认识,一般情况下是没有必要甚至也不可能去对总体中每个观察单位进行全面的逐个研究,而常常是从总体中抽取部分个体来进行抽样研究。

2.样本

为了对总体的分布进行各种研究,就必须对总体进行抽样观察。抽样是指从总体中按照一定的规则抽出一部分个体的行动。一般都是从总体中抽取一部分个体进行观察,然后根据观察所得数据来推断总体的性质。样本(sample)是从总体中随机抽取的具有代表性的一组个体(X1X2,…,Xn)的集合。

为了能更多更好地得到总体的信息,需要进行多次重复、独立的抽样观察(一般进行n次),对抽样有以下要求。

①代表性:每个个体被抽到的机会一样,保证了(X1X2,…,Xn)的分布相同,与总体一样。

②独立性:(X1X2,…,Xn)相互独立。那么,符合“代表性”和“独立性”要求的样本(X1X2,…,Xn)称为简单随机样本。通常来讲,X<30的样本称作小样本,X>30的样本叫大样本。统计分析通常是通过样本来了解总体,这是因为有的总体是无限的、假想的,即使是有限的但包含的个体数目也很多,要获得全部观测值需花费大量的人力、物力和时间,或者观测值的获得带有破坏性。研究的目的是要了解总体,然而能观测到的却是样本,通过样本来推断总体是统计分析的基本特点。

二、参数与统计量

为了表示总体和样本的数量特征,需要计算出几个特征数。反映总体的统计指标叫参数(parameter),常用希腊字母表示参数,如用μ表示总体平均数,用σ表示总体标准差。反映样本的统计指标称为统计量(statistic),常用拉丁字母表示统计量,如用x-表示样本平均数,用S表示样本标准差。总体参数由相应的统计量来估计,如用x-估计μ,用S估计σ等。

三、试验指标

试验指标(experimental index):在试验设计中,根据试验的目的而选定的用来衡量或考核试验效果质量的特性称为试验指标,又称试验效果,通常用y表示。它可以是单一的指标(包括综合评价指标),也可以是多个指标。例如,在考查加热温度和加热时间对杀灭牛乳中沙门氏菌的影响时,沙门氏菌的杀灭程度就是试验指标;在考察储存方式对香椿维生素C含量的影响时,香椿的维生素C的含量就是试验指标。

试验指标可分为数量指标(如质量、强度、精度、合格率、寿命、成本等)和非数量指标(如光泽、颜色、味道、手感等)。试验设计中,应该尽量使非数量指标数量化。试验指标还可分为定性指标与定量指标。定性指标是指不能用数量表示的,而是由人的感官直接评定的指标,如苹果的色泽、草莓的风味、蜂蜜的口感、面粉的手感等。定量指标是指能用某种仪器或工具准确测量的,能够用数量表示的指标,如梨子的糖度、酸度、pH、吸光度和合格率等。

试验指标可以是一个也可以同时是几个,前者称单指标试验设计,后者称多指标试验设计。不论是单项指标还是多项指标,都是以专业为主确定的,并且要尽量满足用户和消费者的要求,指标值应从本质上表示出某项性能,绝不能用几个重复的指标值表示某一性能。

四、试验因素及水平

1.试验因素(experimental factor)(www.xing528.com)

在试验过程中,凡对试验指标可能产生影响的原因或要素,都称为因素或者因子。通常把研究试验中影响试验指标的因素称为试验因素,通常用A、B、C、D……大写字母表示。把除试验因素外其他所有对试验指标有影响的因素称为条件因素,又称试验条件(experimental conditions)。如,在研究不同储藏条件下的番茄保鲜情况时,温度、保鲜试剂、气调保鲜膜等都是影响试验效果的因素。这几个因素以外的其他所有影响番茄保鲜情况的因素都是条件因素。它们在一起构成了本试验的试验条件。考查一个试验因素的试验叫单因素试验,考查两个因素的试验叫双因素试验,考查3个或3个以上试验因素的试验叫多因素试验。

在许多试验中,不仅因素对指标有影响,而且因素之间还会联合起来对指标发生作用。因素对试验总效果是由每一因素对试验的单独作用再加上各个因素之间的联合作用决定的。这种联合搭配作用称作因素间交互作用。因素A和因素B的交互作用以A×B表示。

因素有多种分类方法,可以把因素分为可控因素和不可控因素。加热温度、熔化温度等人们可以控制和调节的因素,称为可控因素;机床的微振动、刀具的微磨损等人们暂时不能控制和调节的因素,称为不可控因素。试验设计中,一般仅适于可控因素。试验因素又可分为数量因素和非数量因素。数量因数——依据数量划分水平的因素,如温度、pH、时间等;非数量因素——不是依据数量划分水平,如酶的种类等。

2.因素水平(level of factor)

因素水平又称因子水平或叫位级,是指在试验设计中,为考查试验因素对试验指标的影响情况,要使试验因素处于不同的状态,把试验因素所处的各种状态称为试验水平,如研究不同杀菌温度对罐头货架期的影响试验中,不同的温度条件(135℃、140℃、145℃、150℃)就是因素水平。因素水平一般在代表该因素的字母下添加下角标1、2、3 ……来表示。如A1A2A3……,B1B2B3……,C1C2C3……。

在选取水平时,应注意以下三点。①宜选取三水平。这是因为三水平的因素试验结果分析的效应图分布多数呈二次函数曲线,而二次函数曲线有利于观察试验结果的趋势,这对试验分析是有利的。②取等间隔的原则,水平的间隔宽度是由技术水平和技术知识范围所决定的,水平的等间隔一般是取算术等间隔值,在某些场合下也可取对数等间隔值。由于各种客观条件的限制和技术上的原因,在取等间隔区间时可能有些差值,但可以把这个差值尽可能地取小些,一般不超过20%的间隔值。③所选取的水平应是具体的,即水平应该是可以直接控制的,并且水平的变化要能直接影响试验指标有不同程度的变化。

五、试验处理与试验单位

1.试验处理(experimental treatment)

试验处理是指事先设计好的实施在试验单位上的一种具体措施或步骤。在单因素试验中,试验的1个水平就是1个处理。在多因素试验中,由于因素和水平较多,可以形成若干个水平组合。如研究2种不同温度(A1A2)、不同时间(B1B2)和不同菌粉添加量(C1C2)对酸乳发酵效果的影响,可以形成A1B1C1A1B1C2A1B2C1A1B2C2A2B1C1A2B1C2A2B2C1A2B2C28个水平组合,所以在多因素试验中,试验因素的一个水平组合就是一个处理。

2.试验单位(experimental unit)

在试验过程中,能接受不同试验处理的独立试验载体称作试验单位。它是试验中实施试验处理的基本对象,如在生物、医学试验中的小白鼠等。

六、全面试验与部分试验

1.全面试验(overall experiment)

在试验过程中,对所选取的试验因素的所有水平组合全部给予实施的试验称为全面试验。全面试验的优点是能够获得全面的试验信息,各因素及各级交互作用对试验指标的影响剖析得比较清楚。但是当试验因素和水平较多时,试验处理的数目会急剧增加,因而试验次数也会急剧增加。当试验还要设置重复时,试验规模就会非常庞大,以致在实际操作过程中难以实施。如4因素试验,每个因素取4个水平,则需要做44=256次试验,这在实践中通常是做不到的。因此,全面试验是有局限性的,它只适用于因素和水平数目均不多的试验。

2.部分实施(fractional experiment)

在全面试验中,由于试验因素和水平数增多会使处理数量急剧增加,以致难以实施。此外,当试验因素及其水平数较多时,即使全面试验能够实施,通常也并不是一个经济有效的方法。因此,在实际试验研究中,常采用部分实施方法,即从全部试验处理中选取部分有代表性的试验进行处理,如正交试验设计和均匀设计都是部分试验。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈