加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

Hive下查看表占用空间大小的方法

(2016-02-25 16:44:37)
标签:

hive查看表占用空间

hive下查看表信息

hive下查看表存储位置

hive下查询表字段信息

分类: Hadoop大数据学习
一、Hive下查看数据表信息的方法
方法1:查看表的字段信息
desc table_name;

方法2:查看表的字段信息及元数据存储路径
desc extended table_name;

方法3:查看表的字段信息及元数据存储路径
desc formatted table_name;

备注:查看表元数据存储路径时,推荐方法3,信息比较清晰。

二、查看表容量大小
方法1:查看一个hive表文件总大小时(单位为Byte),我们可以通过一行脚本快速实现,其命令如下:
--#查看普通表的容量
$ hadoop fs -ls  /user/hive/warehouse/table_name|awk -F ' ' '{print $5}'|awk '{a+=$1}END{print a}'
48
 
这样可以省去自己相加,下面命令是列出该表的详细文件列表
$ hadoop fs -ls  /user/hive/warehouse/table_name


--#查看分区表的容量 
$ hadoop fs -ls  /user/hive/warehouse/table_name/yyyymm=201601|awk -F ' ' '{print $5}'|awk '{a+=$1}END

{print a/(1024*1024*1024)}'
39.709
 
这样可以省去自己相加,下面命令是列出该表的详细文件列表
$ hadoop fs -ls  /user/hive/warehouse/table_name/yyyymm=201601
 
方法2:查看该表总容量大小,单位为G
$ hadoop fs -du /user/hive/warehouse/table_name|awk '{ SUM += $1 } END { print SUM/(1024*1024*1024)}'





本文参考资料:http://daizj.iteye.com/blog/2256490

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有