加载中…
个人资料
德铭资本
德铭资本
  • 博客等级:
  • 博客积分:0
  • 博客访问:125,009
  • 关注人气:80
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
相关博文
推荐博文
谁看过这篇博文
加载中…
正文 字体大小:

pandas基础:dataframe查看与排序

(2018-03-15 08:19:30)
分类: python
dataframe本身有多个函数可以提前元素包括dtypes/head(n)/tail/index/columns/values/.T等等,其中decribe还能提取某列元素进行一些基础的统计,先看个例子,下面用魔术命令把df2存起来可以在另外一个Notebook里面通过%store -r 提取
pandas基础:dataframe查看与排序

这是一个mixed data types的dataframe,describe的参数有三个,percentiles,include和exclude
pandas基础:dataframe查看与排序

percentiles和Numpy的percentile一样,include与exclude可以按要求提取
pandas基础:dataframe查看与排序

dataframe里面的字符串表达为object,category的格式特别,必须写成['category'],如果提取数字就用Np.number,提取全部就用'all',percentiles可以自己定义,看看官方说明
pandas基础:dataframe查看与排序
pandas基础:dataframe查看与排序
notes里面解释了不同类型的提取会显示什么内容,很详细,对于一个Mixed data的df来说describe()只会显示数字,所以如果要连字符串一起显示需要用'all'

排序则会用到sort_index和sort_values
pandas基础:dataframe查看与排序

sort_values参数by可以对多列进行排序,例如df.sort_values(by=['col1', 'col2']),mergesort是稳定算法但只能按单列排序,ascending是排序方向,inplace是采取In-place算法,np_position是NaN排在前还是后



0

阅读 收藏 禁止转载 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

新浪公司 版权所有