加载中…
个人资料
夏天
夏天
  • 博客等级:
  • 博客积分:0
  • 博客访问:370,522
  • 关注人气:113
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
相关博文
推荐博文
谁看过这篇博文
加载中…
正文 字体大小:

[转载]数据挖掘:异常值检测

(2011-04-23 08:09:32)
标签:

转载

分类: 统计分析

所谓异常值,设置一个变量的值非常极端或者出现的频次非常的低。

 

1)数值型变量异常值检测

数值型的变量异常值检测可以通过PROC UNIVARIATE过程来完成

代码如下:

PROC UNIVARIATE DATA=IREAD.DA_FIN_200909;

 VAR _NUMERIC_;

RUN;

然后查看每个变量的分位数表,分析哪些变量可能存在异常的情况。

 

2)字符型变量异常值检测

字符型的变量异常值检测可以通过PROC FREQ过程来完成

代码如下:

PROC FREQ DATA=IREAD.DA_FIN_200909;

 TABLE 变量1 变量2.../MISSING;

RUN;

查看每个字符型变量的频数分布,发现异常的值。

0

  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有