加载中…
个人资料
黄双斗
黄双斗
  • 博客等级:
  • 博客积分:0
  • 博客访问:7,947
  • 关注人气:230
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

第二十六课         协方差分析2

(2010-09-18 22:03:40)
标签:

杂谈

分类: SAS学习

26.2b          未调整均值和调整均值及均值之间的比较

 

The SAS System

General Linear Models Procedure

         Level of       --------------Y--------------     --------------X--------------

         TRT             Mean              SD              Mean              SD

                    34.4750000       3.18891309       29.7500000       3.20572405

                    31.6500000       1.53731367       27.1750000       0.96046864

                    30.8500000       2.95578529       24.6500000       2.75862284

                    32.2250000       4.29757684       26.4250000       4.04917687

                    25.0250000       3.69898635       20.8000000       3.02103735

Least Squares Means

                     TRT                  Std Err     Pr > |T|   LSMEAN

                                LSMEAN        LSMEAN   H0:LSMEAN=0   Number

                         30.1531125     0.3339174        0.0001     1

                         30.1173006     0.2827350        0.0001     2

                         32.0523296     0.2796295        0.0001     3

                         31.5046854     0.2764082        0.0001     4

                         30.3975719     0.3621988        0.0001     5

                            T for H0: LSMEAN(i)=LSMEAN(j) / Pr > |T|

                        i/j                                   5

                               0.087941   -4.1466  -3.22289  -0.42398

                                       0.9312    0.0010    0.0061    0.6780

                        -0.08794         -4.76003  -3.55771  -0.56861

                             0.9312              0.0003    0.0032    0.5786

                        4.146599   4.76003         1.378002  3.853378

                             0.0010    0.0003              0.1898    0.0018

                        3.222892  3.557715    -1.378         2.346817

                             0.0061    0.0032    0.1898              0.0342

                          0.42398  0.568608  -3.85338  -2.34682     .

                             0.6780    0.5786    0.0018    0.0342

NOTE: To ensure overall protection level, only probabilities associated with pre-planned comparisons should be used.


 

表26.2(b)中结果分析:means语句要求计算按trt每个水平分组的未调整的yx的均值。如 =34.475=(32.6 36.6 37.7 31)/4, =29.75=(27.2 32 33 26.8)/4。Lsmeans语句要求计算调整后的y的均值,或称最小二乘均值估计,我们可以由公式(26.1)求分组平均得到:

 

(26.4)

再由公式(25.2)求分组平均代入上式:

 

(26.5)

 

例如,初始体重的整体平均值为 =(29.750 27.175 24.650 26.425 20.800)/5=25.76,以trt1分组为例,调整后 =30.1531125=34.475-1.083179819×(29.75-25.76)。tdiff选择项要求对已调整均值的两两比较采用lsd检验,可以使用adjust= duncan/waller等选项替代lsd检验,获得其他多重比较的检验结果。从最后的5×5修正均值比较结果表中,可得到( )中的任何一个与( )中的任何一个之间有显著或非常显著性差别。

 

26.2c               有计划的均值对比和参数估计

 

The SAS System

Dependent Variable: Y

Contrast         DF              Contrast SS             Mean Square   F Value     Pr > F

trt12 vs trt34                 8.59108077              8.59108077     28.49     0.0001

 

                                         T for H0:        Pr > |T|       Std Error of

Parameter               Estimate        Parameter=0                        Estimate

trt1 adj mean         30.1531125              90.30         0.0001         0.33391743

trt2 adj mean         30.1173006             106.52         0.0001         0.28273504

adj  trt diff          0.0358120               0.09         0.9312         0.40722674

trt1 unadj mean       34.4750000             125.55         0.0001         0.27458811

trt2 unadj mean       31.6500000             115.26         0.0001         0.27458811

unadj  trt diff        2.8250000               7.27         0.0001         0.38832623


 

表26.2(c)中结果分析:contrast语句通过其后的参数项设置,用来假设检验我们自己计划的原假设 ,结果显示非常显著(0.0001<0.05),即入口处底部和顶部均值之和与出口处底部和顶部均值之和是有显著差异的,说明水中的温度不同对牡蛎生长是不同的。本程序中的estimate语句,有计划地设计了对入口处的底部和顶部调整后均值进行估计,及它们之差是否为0的假设检验,结果为不显著。但如果对未调整均值之差是否为0进行假设检验,结果却为非常显著。因此,我们可以看到使用调整后均值进行估计是必要的。

2.            多元协方差分析

例26.2 研究男女儿童的体表面积是否相同。考虑到儿童的身高和体重对表面积可能有影响,在某地测量了男女各15名初生至3周岁儿童的身高、体重和体表面积,得到测量数据如表26.3所示。

 

26.3                 3周岁男女儿童的身高、体重和体表面积

男(male

女(female

身高(x1)

体重(x2)

表面积(y

身高(x1)

体重(x2)

表面积(y

54.0

3.00

2446.2

54.0

3.00

2117.3

50.5

2.25

1928.4

53.0

2.25

2200.2

51.0

2.50

2094.5

51.5

2.50

1906.2

56.5

3.50

2506.7

51.0

3.00

1850.3

52.0

3.00

2121.0

51.0

3.00

1632.5

76.0

9.50

3845.9

77.0

7.50

3934.0

80.0

9.00

4380.8

77.0

10.0

4180.4

74.0

9.50

4314.2

77.0

9.50

4246.1

80.0

9.00

4078.4

74.0

9.00

3358.8

76.0

8.00

4134.5

73.0

7.50

3809.7

96.0

13.5

5830.2

91.0

12.0

5358.4

97.0

14.0

6013.6

91.0

13.0

5601.7

99.0

16.0

6410.6

94.0

15.0

6074.9

92.0

11.0

5283.3

92.0

12.0

5299.4

94.0

15.0

6101.6

91.0

12.5

5291.5

 

程序如下:

proc format;

value sexname 1=’male’ 2=’female’;

data child;

do i=1 to 15;

do sex=1 to 2;

input x1 x2 y @@;

format sex sexname.;

output;

   end;

end;

cards;

54.0 3.00 2446.2   54.0 3.00 2117.3

50.5 2.25 1928.4   53.0 2.25 2200.2

51.0 2.50 2094.5   51.5 2.50 1906.2

56.5 3.50 2506.7   51.0 3.00 1850.3

52.0 3.00 2121.0   51.0 3.00 1632.5

76.0 9.50 3845.9   77.0 7.50 3934.0

80.0 9.00 4380.8   77.0 10.0 4180.4

74.0 9.50 4314.2   77.0 9.50 4246.1

80.0 9.00 4078.4   74.0 9.00 3358.8

76.0 8.00 4134.5   73.0 7.50 3809.7

96.0 13.5 5830.2   91.0 12.0 5358.4

97.0 14.0 6013.6   91.0 13.0 5601.7

99.0 16.0 6410.6   94.0 15.0 6074.9

92.0 11.0 5283.3   92.0 12.0 5299.4

94.0 15.0 6101.6   91.0 12.5 5291.5

;

proc glm data=child;

class sex;

model y=sex x1 x2 /solution;

lsmeans sex /stderr tdiff;

run;

 

程序说明:本例为带有两个协变量x1和x2,一个分组变量sex的完全随机化设计的多元协方差分析。data步中为了便于读入数据,sex分组变量取值为1和2,但又为了显示清楚,用format过程自定义了sexname.格式,用于sex变量的显示格式。在class语句中只能有sex分组变量,而在model语句中应把观察指标放在等号的左边,分组变量和协变量放在等号的右边,solution选项求回归方程的系数估计。lsmeans语句求修正后均值,stderr选项求均值的标准误差,tdiff选项求均值对比的t值和p值。程序输出的主要结果如表26.4所示。

26.4                        单因素的多元协方差分析

 

The SAS System

General Linear Models Procedure

Dependent Variable: Y

Source           DF           Sum of Squares             Mean Square   F Value     Pr > F

Model                    68523072.11494280       22841024.03831420    557.41     0.0001

Error            26         1065399.75872373          40976.91379707

Corrected Total  29        69588471.87366650

           R-Square                     C.V.                Root MSE               Y Mean

           0.984690                 5.131187            202.42755197        3945.04333333

Source           DF                Type I SS             Mean Square   F Value     Pr > F

SEX                        714100.40833333         714100.40833333     17.43     0.0003

X1                       67440016.91708050       67440016.91708050   1645.81     0.0001

X2                         368954.78952901         368954.78952901      9.00     0.0059

Source           DF              Type III SS             Mean Square   F Value     Pr > F

SEX                        139769.33971381         139769.33971381      3.41     0.0762

X1                         938153.70360865         938153.70360865     22.89     0.0001

X2                         368954.78952901         368954.78952901      9.00     0.0059

                                         T for H0:        Pr > |T|       Std Error of

Parameter               Estimate        Parameter=0                        Estimate

INTERCEPT           -1118.730592 B            -2.25         0.0331        497.2296650

SEX       female     -136.828607 B            -1.85         0.0762         74.0867551

          male          0.000000 B                                     .

X1                     54.477217               4.78         0.0001         11.3853803

X2                    130.645108               3.00         0.0059         43.5387744

NOTE: The X'X matrix has been found to be singular and a generalized inverse was used to solve the normal equations.   Estimates followed by the letter 'B' are biased, and are not unique estimators of the parameters.

                                      Least Squares Means

                  SEX                  Std Err     Pr > |T|    T / Pr > |T| H0:

                             LSMEAN        LSMEAN   H0:LSMEAN=0   LSMEAN1=LSMEAN2

               female    3876.62903      52.32694        0.0001      -1.84687

                                                                       0.0762

               male      4013.45764      52.32694        0.0001


 

表26.4中结果分析:由类型3的平方和计算结果表明,身高、体重对体表面积都有非常显著性的影响(0.0001<0.05,0.0059<0.05),而男、女两性之间无显著性差别(0.0762>0.05)。由回归分析的结果可知道,与x1、x2相对应的公共偏回归系数为 54.477217、 130.645108,它们与0之间差别的检验结果为p=0.0001和p=0.0059。男、女两性体表面积的修正均值分别为52.32694和52.32694,两者之间无显著性差别(p=0.0762)。

 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有