加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

pandas中处理个别列的标准化归一化

(2019-12-05 20:29:48)
标签:

pandas

zscore

某些列

个别列

分类: 大数据处理
# 构造模拟的表格信息
df = pd.DataFrame({"height": np.random.randint(150, 190, size=10),
                   "weight": np.random.randint(40, 90, size=10),
                   "sex": np.random.randint(0, 2, size=10)}) 
print(df)

# 所有列均进行标准化处理
df2 = (df - df.mean()) / df.std()
print(df2)

# 定义函数
z_scaler = lambda x : (x - np.mean(x)) / np.std(x)

# 个别列进行标准化处理
df3 = df[['height', "weight"]].apply(z_scaler)
print(df3)

# 列级别合并,这样就使得个别列标准化
df4 = pd.concat([df[['sex']], df3], axis=1)
print(df4)

0

阅读 收藏 喜欢 打印举报/Report
前一篇:DeepFM算法说明
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有