正交试验设计及其方差分析
(2011-03-09 22:04:28)
标签:
教育 |
分类: 实验设计 |
在工农业生产和科学实验中,为改革旧工艺,寻求最优生产条件等,经常要做许多试验,而影响这些试验结果的因素很多,我们把含有两个以上因素的试验称为多因素试验.前两节讨论的单因素试验和双因素试验均属于全面试验(即每一个因素的各种水平的相互搭配都要进行试验),多因素试验由于要考虑的因素较多,当每个因素的水平数较大时,若进行全面试验,则试验次数将会更大.因此,对于多因素试验,存在一个如何安排好试验的问题.正交试验设计是研究和处理多因素试验的一种科学方法,它利用一套现存规格化的表——正交表,来安排试验,通过少量的试验,获得满意的试验结果.
1.正交试验设计的基本方法
正交试验设计包含两个内容:(1)怎样安排试验方案;(2)如何分析试验结果.先介绍正交表.
正交表是预先编制好的一种表格.比如表9-17即为正交表L4(23),其中字母L表示正交,它的3个数字有3种不同的含义:
表9-17
列号 试验号 |
1 |
1 2 3 4 |
1 1
2
2 |
列数
L4
↑
行数
(2) L4(23)表的用法:做4次试验,最多可安排2水平的因素3个.
L4
↑
试验次数
(3) L4(23)表的效率:3个2水平的因素.它的全面试验数为23=8次,使用正交表只需从8次试验中选出4次来做试验,效率是高的.
L4
↑
实际试验数
正交表的特点:
(1) 表中任一列,不同数字出现的次数相同.如正交表L4(23)中,数字1,2在每列中均出现2次.
(2) 表中任两列,其横向形成的有序数对出现的次数相同.如表L4(23)中任意两列,数字1,2间的搭配是均衡的.
凡满足上述两性质的表都称为正交表(Orthogonal table).
常用的正交表有L9(34),L8(27),L16(45)等,见附表.用正交表来安排试验的方法,就叫正交试验设计.一般正交表Lp(nm)中,p=m(n-1)+1.下面通过实例来说明如何用正交表来安排试验.
例9.7
某种化工产品的转化率可能与反应温度A,反应时间B,某两种原料之配比C和真空度D有关.为了寻找最优的生产条件,因此考虑对A,B,C,D这4个因素进行试验.根据以往的经验,确定各个因素的3个不同水平,如表9-18所示.
表9-18
水平 因素 |
1 |
A:反应温度(℃) |
60 |
B:反应时间(小时) |
2.5 |
C:原料配比 |
1.1∶1
|
D:真空度(毫米汞柱) |
500 |
分析各因素对产品的转化率是否产生显著影响,并指出最好生产条件.
解
表9-19
列号 水平 试验号 |
A
1 |
1 2 3 4 5 6 7 8 9 |
1
1
1
2
2
2
3
3
3 |
把表头上各因素相应的水平任意给一个水平号.本例的水平编号就采用表9-18的形式;将各因素的诸水平所表示的实际状态或条件代入正交表中,得到9个试验方案,如表9-20所示.
表9-20
列号 水平 试验号 |
A
1 |
1 2 3 4 5 6 7 8 9 |
1(60)
1
1
2(70) 2
2
3(80)
3
3 |
从表9-20看出,第一行是1号试验,其试验条件是:
反应温度为60℃,反应时间为2.5小时,原料配比为1.1∶1,真空度为500毫米汞柱,记作A1B1C1D1.依此类推,第9号试验条件是A3B3C2D1.
由此可见,因素和水平可以任意排,但一经排定,试验条件也就完全确定.按正交试验表9-20安排试验,试验的结果依次记于试验方案右侧,见表9-21.
表9-21
列号 水平 试验号 |
A |
试验结果(%) |
1 2 3 4 5 6 7 8 9 |
1(60)
1
1
2(70)
2
2
3(80)
3
3 |
38 37 76 51 50 82 44 55 86 |
2.试验结果的直观分析
正交试验设计的直观分析就是要通过计算,将各因素、水平对试验结果指标的影响大小,通过极差分析,综合比较,以确定最优化试验方案的方法.有时也称为极差分析法.
例9.7中试验结果转化率列在表9-21中,在9次试验中,以第9次试验的指标86为最高,其生产条件是A3B3C2D1.由于全面搭配试验有81种,现只做了9次.9次试验中最好的结果是否一定是全面搭配试验中最好的结果呢?还需进一步分析.
(1) 极差计算
在代表因素A的表9-21的第1列中,将与水平“1”相对应的第1,2,3号3个试验结果相加,记作T11,求得T11=151.同样,将第1列中与水平“2”对应的第4,5,6号试验结果相加,记作T21,求得T21=183.
一般地,定义Tij为表9-21的第j列中,与水平i对应的各次试验结果之和(i=1,2,3; j=1,2,3,4).记T为9次试验结果的总和,Rj为第j列的3个Tij中最大值与最小值之差,称为极差.
显然T= ,j=1,2,3,4.
此处T11大致反映了A1对试验结果的影响,
T21大致反映了A2对试验结果的影响,
T31大致反映了A3对试验结果的影响,
T12,T22和T32分别反映了B1,B2,B3对试验结果的影响,
T13,T23和T33分别反映了C1,C2,C3对试验结果的影响,
T14,T24和T34分别反映了D1,D2,D3对试验结果的影响.
Rj反映了第j列因素的水平改变对试验结果的影响大小,Rj越大反映第j列因素影响越大.上述结果列表9-22.
表9-22
T1j T2j T3j |
151
183
185 |
T=519 |
Rj |
34 |
|
由极差大小顺序排出因素的主次顺序:
主→次
B;A、D;C
这里,Rj值相近的两因素间用“、”号隔开,而Rj值相差较大的两因素间用“;”号隔开.由此看出,特别要求在生产过程中控制好因素B,即反应时间.其次是要考虑因素A和D,即要控制好反应温度和真空度.至于原料配比就不那么重要了.
选择较好的因素水平搭配与所要求的指标有关.若要求指标越大越好,则应选取指标大的水平.反之,若希望指标越小越好,应选取指标小的水平.例9.7中,希望转化率越高越好,所以应在第1列选最大的T31=185;即取水平A3,同理可选B3C1D3.故例9.7中较好的因素水平搭配是A3B3C1D3.
例9.8
表9-23
列号 水平 试验号 |
A
1 |
试验结果 |
1 2 3 4 5 6 7 8 |
1
1
1
1
2
2
2
2 |
14 13 17 17 8 10 11 15 |
T1j T2j |
61 44 |
T=105 |
Rj |
17 |
|
试验目的要找出试验结果最小的工艺条件及因素影响的主次顺序.从表9-23的极差Rj的大小顺序排出因素的主次顺序为
主 → 次
A、B;D;C、E
最优工艺条件为A2B1C1D2E1.
表9-23中因没有安排因素而空出了第3,6列.从理论上说,这两列的极差Rj应为0,但因存有随机误差,这两个空列的极差值实际上是相当小的.
3.方差分析
正交试验设计的极差分析简便易行,计算量小,也较直观,但极差分析精度较差,判断因素的作用时缺乏一个定量的标准.这些问题要用方差分析解决.
设有一试验,使用正交表Lp(nm),试验的p个结果为y1,y2,…,yp,记
T= ,
ST=
为试验的p个结果的总变差;
Sj=
为第j列上安排因素的变差平方和,其中r=p/n.可证明
ST=
即总变差为各列变差平方和之和,且ST的自由度为p-1,Sj的自由度为n-1.当正交表的所有列没被排满因素时,即有空列时,所有空列的Sj之和就是误差的变差平方和Se,这时Se的自由度fe也为这些空列自由度之和.当正交表的所有列都排有因素时,即无空列时,取Sj中的最小值作为误差的变差平方和Se.
从以上分析知,在使用正交表Lp(nm)的正交试验方差分析中,对正交表所安排的因素选用的统计量为:
F= .
当因素作用不显著时,
F~F(n-1,fe),
其中第j列安排的是被检因素.
在实际应用时,先求出各列的Sj/(n-1)及Se/fe,若某个Sj/(n-1)比Se/fe还小时,则这第j列就可当作误差列并入Se中去,这样使误差Se的自由度增大,在作F检验时会更灵敏,将所有可当作误差列的Sj全并入Se后得新的误差变差平方和,记为SeΔ,其相应的自由度为feΔ,这时选用统计量
F=
例9.9
解
表9-24
|
A
1 |
|
Rj |
17 |
|
Sj |
36.125 |
ST=74.875 |
表9-24中第3,6列为空列,因此Se=S3+S6=1.250,其中fe=1+1=2,所以Se/fe=0.625,而第7列的S7=0.125,S7/f7=0.1251=0.125比Se/fe小,故将它并入误差.
SeΔ=Se+S7=1.375,feΔ=3.整理成方差分析表9-25.
表9-25
方差来源 |
Sj |
fj |
|
F= |
显著性 |
A |
36.125 |
1 |
36.125 |
78.818 |
|
B |
28.125 |
1 |
28.125 |
61.364 |
|
C |
3.125 |
1 |
3.125 |
6.818 |
|
D |
6.125 |
1 |
6.125 |
13.364 |
|
EΔ |
0.125 |
1 |
0.125 |
|
|
e |
1.1250 |
2 |
0.625 |
|
|
eΔ |
1.375 |
3 |
0.458 |
|
|
由于F0.05(1,3)=10.13, F0.01(1,3)=34.12,故因素A,B作用高度显著,因素C作用不显著,因素D作用显著,这与前面极差分析的结果是一致的.F检验法要求选取Se,且希望fe要大,故在安排试验时,适当留出些空列会有好处的.前面的方差分析中,讨论因素A和B的交互作用A×B.这类交互作用在正交试验设计中同样有表现,即一个因素A的水平对试验结果指标的影响同另一个因素B的水平选取有关.当试验考虑交互作用时,也可用前面讲的基本方法来处理.本章就不再介绍了.