Presto与HUE的集成
| 分类: 大数据_hadoop_spark |
在做大数据平台的时候,前台查询展示是一个大块。对于小公司或者刚起步的项目而言,没有时间与资源重新开发,最明智的选择就是选一个开源架构,适当改改就用了。目前,找了一圈,感觉没有比HUE更理想的。谁有好建议,可以提哈~
由于我们用的是apache开源版,不像cloudera把一切都集成进了HUE,比如impala。而我们的选择更倾向Presto。别问我原因,别问我2者区别在哪...只能说这是团队的选择。
Presto常见的是命令行Presto-cli,而我们又没有JD那么强大的实力去DIY自己的前端。只能去找开源的集成。有人推荐了Zepllin。如果仅仅作为查询来说,还不错。但是每个查询都要前置%jdbc也是够烦人的~
到处找Presto集成进入HUE的方案,确实找到了一家,思路很巧妙,借助RDBMS做Gateway。下面就简述过程:
参考:
https://github.com/treasure-data/prestogres#i-can-connect-from-localhost-but-cannot-from-remote-host
https://medium.com/@ilkkaturunen/integrating-presto-with-hue-61702b244839#.6tzg4qvjd
心得记录一下:
1.
Prestogres是一个中间件,将postgresql封装到python脚本里面,调用presto的API
2. HUE集成Postgresql,体现在DB Query模块里面
3. 启动服务:
- /usr/local/bin/prestogres-ctl postgres -D pgdata
- /usr/local/bin/prestogres-ctl pgpool
后一篇:HiveServer2参数优化

加载中…