尚硅谷大数据技术之高频面试题
(2019-12-01 19:51:52)
标签:
itjava培训linux大数据尚硅谷 |
目录
4.2.2 Hadoop配置文件以及简单的Hadoop集群搭建
4.2.4 MapReduce的Shuffle过程及Hadoop优化(包括:压缩、小文件、集群优化)
4.2.6 Yarn的默认调度器、调度器分类、以及他们之间的区别
4.5.15 Kafka消息数据积压,Kafka消费能力不足怎么处理?
4.10.2 Spark任务使用什么进行提交,javaEE界面还是脚本
4.10.4
4.10.5
4.10.6
4.10.7
4.10.8
4.10.9
4.10.11 Spark常用算子reduceByKey与groupByKey的区别,哪一种更具优势?(重点)
4.10.12 Repartition和Coalesce关系与区别
4.10.13
4.10.14
4.10.15
4.10.16
4.10.17
SparkSQL中join操作与left
4.10.18 SparkStreaming有哪几种方式消费Kafka中的数据,它们之间的区别是什么?
4.10.19
4.10.20
4.10.21
4.10.22
本教程由尚硅谷教育大数据研究院出品,如需转载请注明来源,欢迎大家关注尚硅谷公众号(atguigu)了解更多。