决策树:训练误差和检验误差图

分类: SAS_Data_Mining |
在决策树的章节我们经常会看到一幅训练误差和检验误差图,用于说明过拟合现象,即模型的训练误差随着模型复杂度的增加而降低,但模型的检验误差却随着复杂度的增加先降低后增加。
我们看看用SAS如何验证这种现象并生成相应的训练误差和检验误差图。
libname sampsio "!sasroot\mmcommon\sample";
%macro Misc_rate_by_depth(depth=20);
proc delete data=misc;
run;
%do i=1 %to &depth;
proc arbor data=sampsio.hmeq_train criterion=ENTROPY splitsize=2
maxbranch=2 maxdepth=&i;
run;quit;
data misc_train;
run;
data misc_test;
run;
proc append base=misc data=misc_train force nowarn;
run;quit;
proc append base=misc data=misc_test force nowarn;
run;quit;
%end;
%mend Misc_rate_by_depth;
%Misc_rate_by_depth(depth=20);
proc sgplot data=misc;
run;quit;
结果如下图所示: