加载中…
个人资料
cheriec
cheriec
  • 博客等级:
  • 博客积分:0
  • 博客访问:409,956
  • 关注人气:294
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
博文
博文
标签:

distribute

by

sort

hive

it

分类: hadoop
最近在优化hiveSQL,

下面是一段排序,分组后取每组第一行记录的SQL

  1. INSERT OVERWRITE TABLE t_wa_funnel_distinct_temp PARTITION (pt='${SRCTIME}'
  2. SELECT 
  3.     bussiness_id, 
  4.     cookie_id, 
  5.     session_id, 
  6.     funnel_id, 
  7.     group_first(funnel_name) funnel_name, 
  8.     step_id, 
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有