加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

pandas(四):HDF5数据存储/读取

(2018-08-29 12:48:13)
标签:

it

分类: 利用python进行数据分析

如果要处理的数据批量很大时,可以用HDF5来存储和读取,并且可以进行检索;

Frame=pd.DataFrame({a:np.arange(100)})

Way1: 存储/读取

Store = pd.HDFStore(mydata.h5)  #frame数据存入store

Store[obj1]=frame #store[obj1]中存frame

Store[obj1_column] =frame[a] #store[obj1_column]frame中的column a

>>>store  #可以获得store中所有信息的description

>>>store[obj1] #提取出obj1中存储的frame

>>>store[obj1_column] #提取frame column中的信息

HDFStore支持两种存储 format{fixed,table}

Store.put(obj2,frame,format=table) #frametable的形式存储在store[obj2]

Store.select(obj2,where=[index >= 10 and index <= 15]) #store[obj2]中符合index条件的数据提取出来,呈现在output

Store.close() #关闭store

 

Way2:第二种存储/读取方式

Frame.to_hdf(mydata.h5,obj3,format=table) #frame存储到mydata.h5中,存储形式为table

Pd.read_hdf(mydata.h5,obj3,where=[index < 5]) #读取mydata.h5index<5得数据到output

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有