加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

用SAS进行数据挖掘:异常值检测_数据分析师考试

(2015-06-27 10:12:22)
标签:

数据分析师

数据分析官网

it

数据分析师培训

教育

用SAS进行数据挖掘:异常值检测_数据分析师考试


 

所谓异常值,设置一个变量的值非常极端或者出现的频次非常的低。


1)数值型变量异常值检测

数值型的变量异常值检测可以通过PROC UNIVARIATE过程来完成

代码如下:

PROC UNIVARIATE DATA=IREAD.DA_FIN_200909;

VAR _NUMERIC_;

RUN;

然后查看每个变量的分位数表,分析哪些变量可能存在异常的情况。

http://cda.pinggu.org/view/9809.html

2)字符型变量异常值检测

字符型的变量异常值检测可以通过PROC FREQ过程来完成

代码如下:

PROC FREQ DATA=IREAD.DA_FIN_200909;

 TABLE 变量1 变量2.../MISSING;

RUN;

查看每个字符型变量的频数分布,发现异常的值。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有