hadoop面试100道收集(带答案),hadoop面试葵花宝典
仅限于工作年限1-3年
一、HIVE岗
1.order by,distribute by,sortby difference单击打开链接。
2.内部表和外部表的区别以及使用场景。单击打开链接。
3.说说Hadoop生态系统的组成,说说你对Hadoop的了解(需要了解和记忆)。单击打开链接。
4.点击4。4.join中需要注意什么(hive查询和优化方法中需要注意什么)打开链接。
5.视图和表格之间的差异单击打开链接
zhangyue:
Java虚拟机点击打开链接。
2.什么是2。Hbase,Impala和Hive用于?黑斑羚和蜂巢有什么区别?它们的优缺点是什么?单击打开链接。
python3.x有哪些新功能可以点击链接打开?
4.4.hive优化操作有哪些?如何添加打开动态分区的链接?如何修改表中的列名
5.说说平时的模型是怎么建立的,函数有什么参数,怎么优化,得到什么结果。(口语模型设计流程)))。
6.要查看占用端口的6.linux,请单击链接将其打开。
7.更改文件夹所属用户单击打开链接的方式。
8.hadoop检查文件夹大小,点击链接打开。
9.假设io打开链接
10.为什么要用python?与其在shell上编写脚本,不如单击open链接。
11.场景:再次点击abc的三个维度,用户id相同。如何打开链接?
yainfo:
1.机架感知单击打开链接。
2.2.hive是哪个函数?单击链接将其打开。
3.有没有模型设计的整体流程和具体实例?为什么要用这种模式?有什么优势?(口腔模型设计流程))。
4.4.hive和Mysql是什么关系?Sqoop如何点击打开链接(开发)和点击打开链接(入门)。
5.一般如何使用索引,在什么场合(hive)点击打开链接(mysql)点击打开链接。
6.6.impala和hive是如何关联的,如何点击打开链接?
renrenche
1.正则表达式的标点符号有哪些?当你点击这里时,链接会打开吗?
2.点击2。要打开的Datanode和namenode联系人链接。
3 .黑斑羚特征点击开放链接
4.单击4.hive中矩阵转换的打开链接。
5.在5.java点击linklist和ArrayList的区别链接打开它。
6.如何在shell中验证click命令执行成功,链接是否打开?
记下hive的udf,然后单击打开链接。
8.点击Mr的工作模式链接打开。
9.如何看主键索引、普通索引、单个索引点击打开链接是否成功?
10.10.hive如何用制表符分隔字符串,点击打开链接?
1.ETL中最重要的是什么(数据的正确性))。
金山云
1.1.datanode和namenode是如何打开的?
2.单击2.java打开链接。
3.3.storm的ack机制是如何保证你点击打开链接不丢失数据的?
4.检查进程、端口和内存并打开链接。
5.5.awk如何点击打开链接
6.两个无序的文件如何实现排序和效率?
二、数据仓库岗
1.你是如何建立数据仓库的?你有什么样的数据仓库?
2.你的事实表和维度表里面有什么?是一个什么样的过程?
3.spark_streaming你熟悉吗?平时怎么用
三、ETL岗
58daojia
1.请试着描述一下ETL的过程
2.spark应用场景,spark_streaming使用示例
四、大数据开发岗
同样的问题:
1.跳槽的原因是什么?
2.你的职业发展计划是什么?
3.你期望的薪水是多少?一般来说,前面不顺利就不是问题。
4.你写了多少行代码?
5.你在工作中遇到的最大问题是什么?你是怎么解决的?
6.你的缺点是什么?你的优势是什么
7.对你来说发展最快的项目是什么?