加载中…
个人资料
追军情怀
追军情怀
  • 博客等级:
  • 博客积分:0
  • 博客访问:89,079
  • 关注人气:6
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
相关博文
推荐博文
谁看过这篇博文
加载中…
正文 字体大小:

python中pandas的使用方法

(2016-03-15 16:10:12)
分类: python编程
# coding:utf-8
__author__ = 'weekyin'
import numpy as np
import pandas as pd
datas = pd.date_range('20140729', periods=6)
# 先创建一个时间索引,所谓的索引(index)就是每一行数据的id,可以标识每一行的唯一值
print datas
# 为了快速入门,我们看一下如何创建一个6X4的数据:randn函数用于创建随机数,参数表示行数和列数,dates是上一步创建的索引列
df = pd.DataFrame(np.random.randn(6, 4), index=datas, columns=list('ABCD'))
print df
# 我们还可以使用字典来创建数据框,例如创建一个列名为A的数据框,索引是自动创建的整数
df2 = pd.DataFrame({'A': np.random.randn(6), })
print df2
# 这又是一个字典创建DataFrame的例子
df2 = pd.DataFrame({'A': pd.Timestamp('20140729'), 'B': pd.Series(1), })
print df2
# 假如字典内的数据长度不同,以最长的数据为准,比如B列有4行:
df2 = pd.DataFrame({'A': pd.Timestamp('20140729'), 'B': pd.Series(1, index=list(range(4))), })
print df2
# 可以使用dtypes来查看各行的数据格式
print df2.dtypes
# 接着看一下如何查看数据框中的数据,看一下所有的数据
print df
# 使用head查看前几行数据(默认是前5行),不过你可以指定前几行
print df.head()
# 查看前三行数据
print df.head(3)
# 使用tail查看后2行数据
print df.tail(2)
# 查看数据框的索引
print df.index
# 查看列名用columns
print df.columns
# 查看数据值,用values
print df.values
# 查看描述性统计,用describe
print df.describe()
# 使用type看一下输出的描述性统计是什么样的数据类型——DataFrame数据
print type(df.describe())
# 使用T来转置数据,也就是行列转换
print df.T
# 对数据进行排序,用到了sort,参数可以指定根据哪一列数据进行排序。
print df.sort(columns='C')

0

阅读 评论 收藏 转载 喜欢 打印举报/Report
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有