加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

Presto与HUE的集成

(2016-06-28 16:05:46)
分类: 大数据_hadoop_spark
在做大数据平台的时候,前台查询展示是一个大块。对于小公司或者刚起步的项目而言,没有时间与资源重新开发,最明智的选择就是选一个开源架构,适当改改就用了。目前,找了一圈,感觉没有比HUE更理想的。谁有好建议,可以提哈~

由于我们用的是apache开源版,不像cloudera把一切都集成进了HUE,比如impala。而我们的选择更倾向Presto。别问我原因,别问我2者区别在哪...只能说这是团队的选择。

Presto常见的是命令行Presto-cli,而我们又没有JD那么强大的实力去DIY自己的前端。只能去找开源的集成。有人推荐了Zepllin。如果仅仅作为查询来说,还不错。但是每个查询都要前置%jdbc也是够烦人的~

到处找Presto集成进入HUE的方案,确实找到了一家,思路很巧妙,借助RDBMS做Gateway。下面就简述过程:

参考:
https://github.com/treasure-data/prestogres#i-can-connect-from-localhost-but-cannot-from-remote-host
https://medium.com/@ilkkaturunen/integrating-presto-with-hue-61702b244839#.6tzg4qvjd

心得记录一下:
1. Prestogres是一个中间件,将postgresql封装到python脚本里面,调用presto的API
2. HUE集成Postgresql,体现在DB Query模块里面
3. 启动服务:
  • /usr/local/bin/prestogres-ctl postgres -D pgdata
  • /usr/local/bin/prestogres-ctl pgpool

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有