用SAS进行数据挖掘:异常值检测_数据分析师考试
(2015-06-27 10:12:22)
标签:
数据分析师数据分析官网it数据分析师培训教育 |
所谓异常值,设置一个变量的值非常极端或者出现的频次非常的低。
1)数值型变量异常值检测
数值型的变量异常值检测可以通过PROC UNIVARIATE过程来完成
代码如下:
| PROC UNIVARIATE
DATA=IREAD.DA_FIN_200909;
VAR _NUMERIC_; RUN; |
然后查看每个变量的分位数表,分析哪些变量可能存在异常的情况。
http://cda.pinggu.org/view/9809.html
2)字符型变量异常值检测
字符型的变量异常值检测可以通过PROC FREQ过程来完成
代码如下:
| PROC FREQ
DATA=IREAD.DA_FIN_200909;
RUN; |
查看每个字符型变量的频数分布,发现异常的值。
后一篇:据分析和的市场调研方法和方式

加载中…