加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

数据预处理-数据变换

(2016-03-01 18:26:59)
标签:

变换

分类: 数据分析
(1)加权变换法
     归一化方法是把各个变量对分类的影响都拉到同一个水平上,而加权变换则是人为地加大某个,或某些变量的影响。其做法就是在不同的变量上乘以不同的权值,权值越大影响越大。当然,权值不能随便加,一般要根据专家的意见,或经验等来选择。
(2)变量变换法
    变量变换就是对原变量进行某些数学变换,常用的数学变换包括平方、开方、对数等, 对某些特定场景的数据还经常进行傅立叶变换、Hadamard变换等。变量变换的目的是改变数据的标度,更好的适应分类。
 (3)变量组合法
    根据实际情况,也可以把两个或多个变量进行组合,组合方式有多种,例如变量相加、变量相减、加权相加、加权相减和变量相比等。
    总之,对于不同的情况可以采用不同的预处理方法,这不但需要正确理解各种预处理方法的物理意义,同时也必须结合不同问题的具体化学经验来对原始数据进行预处理,不可统而论之。所以我们在选取数据的预处理方法的时候要选择哪个最适合我们模型的方法。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有