第二十六课 协方差分析2
(2010-09-18 22:03:40)
标签:
杂谈 |
分类: SAS学习 |
表26.2(b)
The SAS System General Linear Models Procedure
Least Squares Means
NOTE: To ensure overall protection level, only probabilities associated with pre-planned comparisons should be used. |
表26.2(b)中结果分析:means语句要求计算按trt每个水平分组的未调整的y和x的均值。如 =34.475=(32.6 36.6 37.7 31)/4, =29.75=(27.2 32 33 26.8)/4。Lsmeans语句要求计算调整后的y的均值,或称最小二乘均值估计,我们可以由公式(26.1)求分组平均得到:
|
(26.4) |
再由公式(25.2)求分组平均代入上式:
|
(26.5) |
例如,初始体重的整体平均值为 =(29.750 27.175 24.650 26.425 20.800)/5=25.76,以trt1分组为例,调整后 =30.1531125=34.475-1.083179819×(29.75-25.76)。tdiff选择项要求对已调整均值的两两比较采用lsd检验,可以使用adjust= duncan/waller等选项替代lsd检验,获得其他多重比较的检验结果。从最后的5×5修正均值比较结果表中,可得到( )中的任何一个与( )中的任何一个之间有显著或非常显著性差别。
表26.2(c)
The SAS System Dependent Variable: Y
Contrast trt12 vs
trt34
Parameter trt1 adj
mean trt2 adj
mean adj trt1 unadj
mean trt2 unadj
mean unadj |
表26.2(c)中结果分析:contrast语句通过其后的参数项设置,用来假设检验我们自己计划的原假设 ,结果显示非常显著(0.0001<0.05),即入口处底部和顶部均值之和与出口处底部和顶部均值之和是有显著差异的,说明水中的温度不同对牡蛎生长是不同的。本程序中的estimate语句,有计划地设计了对入口处的底部和顶部调整后均值进行估计,及它们之差是否为0的假设检验,结果为不显著。但如果对未调整均值之差是否为0进行假设检验,结果却为非常显著。因此,我们可以看到使用调整后均值进行估计是必要的。
2.
例26.2 研究男女儿童的体表面积是否相同。考虑到儿童的身高和体重对表面积可能有影响,在某地测量了男女各15名初生至3周岁儿童的身高、体重和体表面积,得到测量数据如表26.3所示。
表26.3
男(male) |
女(female) |
||||
身高(x1) |
体重(x2) |
表面积(y) |
身高(x1) |
体重(x2) |
表面积(y) |
54.0 |
3.00 |
2446.2 |
54.0 |
3.00 |
2117.3 |
50.5 |
2.25 |
1928.4 |
53.0 |
2.25 |
2200.2 |
51.0 |
2.50 |
2094.5 |
51.5 |
2.50 |
1906.2 |
56.5 |
3.50 |
2506.7 |
51.0 |
3.00 |
1850.3 |
52.0 |
3.00 |
2121.0 |
51.0 |
3.00 |
1632.5 |
76.0 |
9.50 |
3845.9 |
77.0 |
7.50 |
3934.0 |
80.0 |
9.00 |
4380.8 |
77.0 |
10.0 |
4180.4 |
74.0 |
9.50 |
4314.2 |
77.0 |
9.50 |
4246.1 |
80.0 |
9.00 |
4078.4 |
74.0 |
9.00 |
3358.8 |
76.0 |
8.00 |
4134.5 |
73.0 |
7.50 |
3809.7 |
96.0 |
13.5 |
5830.2 |
91.0 |
12.0 |
5358.4 |
97.0 |
14.0 |
6013.6 |
91.0 |
13.0 |
5601.7 |
99.0 |
16.0 |
6410.6 |
94.0 |
15.0 |
6074.9 |
92.0 |
11.0 |
5283.3 |
92.0 |
12.0 |
5299.4 |
94.0 |
15.0 |
6101.6 |
91.0 |
12.5 |
5291.5 |
程序如下:
proc format; |
value sexname 1=’male’ 2=’female’; |
data child; |
do i=1 to 15; |
do sex=1 to 2; |
input x1 x2 y @@; |
format sex sexname.; |
output; |
|
end; |
cards; |
54.0 3.00 2446.2 |
50.5 2.25 1928.4 |
51.0 2.50 2094.5 |
56.5 3.50 2506.7 |
52.0 3.00 2121.0 |
76.0 9.50 3845.9 |
80.0 9.00 4380.8 |
74.0 9.50 4314.2 |
80.0 9.00 4078.4 |
76.0 8.00 4134.5 |
96.0 13.5 5830.2 |
97.0 14.0 6013.6 |
99.0 16.0 6410.6 |
92.0 11.0 5283.3 |
94.0 15.0 6101.6 |
; |
proc glm data=child; |
class sex; |
model y=sex x1 x2 /solution; |
lsmeans sex /stderr tdiff; |
run; |
程序说明:本例为带有两个协变量x1和x2,一个分组变量sex的完全随机化设计的多元协方差分析。data步中为了便于读入数据,sex分组变量取值为1和2,但又为了显示清楚,用format过程自定义了sexname.格式,用于sex变量的显示格式。在class语句中只能有sex分组变量,而在model语句中应把观察指标放在等号的左边,分组变量和协变量放在等号的右边,solution选项求回归方程的系数估计。lsmeans语句求修正后均值,stderr选项求均值的标准误差,tdiff选项求均值对比的t值和p值。程序输出的主要结果如表26.4所示。
表26.4
The SAS System General Linear Models Procedure Dependent Variable: Y
Source
Model
Error Corrected Total
Source
SEX
X1
X2
Source
SEX
X1
X2
Parameter
INTERCEPT
SEX
X1
X2 NOTE: The X'X matrix has been found to be singular and a
generalized inverse was used to solve the normal
equations.
|
表26.4中结果分析:由类型3的平方和计算结果表明,身高、体重对体表面积都有非常显著性的影响(0.0001<0.05,0.0059<0.05),而男、女两性之间无显著性差别(0.0762>0.05)。由回归分析的结果可知道,与x1、x2相对应的公共偏回归系数为 54.477217、 130.645108,它们与0之间差别的检验结果为p=0.0001和p=0.0059。男、女两性体表面积的修正均值分别为52.32694和52.32694,两者之间无显著性差别(p=0.0762)。