加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

Pandas对DataFrame单列/多列进行运算(map,apply,transform,agg)

(2018-08-03 10:57:52)
标签:

pandas

python3

数据处理

分类: Python

1.单列运算

在Pandas中,DataFrame的一列就是一个Series, 可以通过map来对一列进行操作:


df['col2'] = df['col1'].map(lambda x: x**2)

其中lambda函数中的x代表当前元素。可以使用另外的函数来代替lambda函数,例如:


  1. define square(x):
  2. return (x ** 2)
  3. df['col2'] = df['col1'].map(square)

2.多列运算

要对DataFrame的多个列同时进行运算,可以使用apply,例如col3 = col1 + 2 * col2:


df['col3'] = df.apply(lambda x: x['col1'] + 2 * x['col2'], axis=1)

其中x带表当前行,可以通过下标进行索引。


3.分组运算

可以结合groupby与transform来方便地实现类似SQL中的聚合运算的操作:


df['col3'] = df.groupby('col1')['col2'].transform(lambda x: (x.sum() - x) / x.count())

在transform函数中x.sum()与x.count()与SQL类似,计算的是当前group中的和与数量,还可以将transform的结果作为一个一个映射来使用, 例如:


  1. sumcount = df.groupby('col1')['col2'].transform(lambda x: x.sum() + x.count())
  2. df['col1'].map(sumcount)

对col1进行一个map,得到对应的col2的运算值。


4.聚合函数

结合groupby与agg实现SQL中的分组聚合运算操作,需要使用相应的聚合函数:


df['col2'] = df.groupby('col1').agg({'col1':{'col1_mean': mean, 'col1_sum‘’: sum}, 'col2': {'col2_count': count}})
上述代码生成了col1_mean, col1_sum与col2_count列。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有