加载中…
http://blog.sina.com.cn/u/1295663604
首页
博文目录
关于我
个人资料
cheriec
微博
加好友
发纸条
写留言
加关注
博客等级:
博客积分:
0
博客访问:
409,956
关注人气:
294
获赠金笔:
0支
赠出金笔:
0支
荣誉徽章:
博文
hive SQL优化之distribute b…
2012-03-30 09:44
更多
>>
博文
hive SQL优化之distribute by和sort by
(2012-03-30 09:44)
转载
▼
标签:
distribute
by
sort
hive
it
分类:
hadoop
最近在优化hiveSQL,
下面是一段排序,分组后取每组第一行记录的SQL
INSERT
OVERWRITE
TABLE
t_wa_funnel_distinct_temp
PARTITION
(
pt
=
'${SRCTIME}'
)
SELECT
bussiness_id,
cookie_id,
session_id,
funnel_id,
group_first(funnel_name)
funnel_name,
step_id,
阅读
收藏
查看全文
>>