大数据工程师的职业素养,大数据软件工程师需要知识嘛,大数据工程师需要具备哪些能力

  大数据工程师的职业素养,大数据软件工程师需要知识嘛,大数据工程师需要具备哪些能力

  经常看到有近几万的朋友在疑惑学习Java应该选择哪个开发方向。我们在上一篇文章中已经提到了这一点。Java开发在这个领域有三种选择:

  JavaEE,主要用于企业应用开发;安卓发展方向;嵌入式应用开发方向。这里建议你选择JavaEE方向,因为它应用广泛,工作设置也很多。

  但是我们从来没有讨论过学习Java。这辈子只能做Java后端开发吗?难道只能在这条路上战斗到底吗?中间没有其他选择了吗?

  偶然认识的一个朋友,一开始从事Java后端开发。后来利用业余时间自学成功转入大数据行业。现在是

大数据工程师

的员工,工资比以前好多了。前提是他是Java后端开发者。

  大数据是我们现在的一个热门发展方向。

  但是大数据的起点要高,什么都不用就可以入门。

  我们将要谈到的对大数据的学习是有条件的。首先你需要是一个普通的工程师,如果是Java工程师就更好了,但是如果是危机四伏的天空,那你只有成为工程师之后才能学习大数据。

  

  

认识大数据

  大数据实际上是数据,但它也包括一些新功能:

  

数据来源广;

数据格式多样化

(结构化数据、非结构化数据、Excel文件等。);

数据量大

(至少TB级别,甚至可能PB级别);

数据增长速度快。

并且对于上述新特性有许多问题要考虑:

  比如数据来源很多,如何收集汇总?收集后,应该存放什么?数据存储后,如何通过运算转换成想要的结果?

  我们需要有相应的知识来解决这些问题。

  

  

大数据所需技能要求

  

Python语言:

写一些脚本的时候会用到。

  

Scala语言:

编写Spark程序的最佳语言。当然,你也可以选择Python。

  

Ozzie,azkaban:

用于计划任务的工具。

  

Hue,Zepplin:

图形化任务执行管理和结果查看工具。

  

Allluxio,Kylin等:

通过预处理存储数据来加速操作的工具。

  

必须掌握的技能:

  高级Java(虚拟机、并发)、Linux基本操作、Hadoop(HDFS MapReduce Yarn)、HBase(JavaAPI operation Phoenix)、Hive(HQL基本操作和原理理解)、Kafka、Storm/JStorm、Scala、Python、Spark(核心Spark SQL Spark Streaming)、辅助小工具(Sqoop/Flume/Oozie/Hue)等)

  

高阶技能6条:

  机器学习算法和mahout库加MLlib,r语言,Lambda架构,Kappa架构,Kylin和Alluxio。

  

  

学习规划

  

第一阶段

  

Linux学习:

Linux操作系统介绍及安装,Linux常用命令,Linux常用软件安装,Linux网络,防火墙,Shell编程等。

  

Java 高级学习:

主多线程、契约下队列、JVM技术、反射和动态代理、JMS。

  

Zookeeper学习:

Zookeeper分布式协调服务介绍,Zookeeper集群的安装部署,Zookeeper数据结构,命令。

  

第二阶段

  Hadoop、Hive、HBase、Scala、Spark、Python

  

第三阶段

  Sqoop、Flume、Oozie、Hue主要可以在CSDN、51CTO和官网学习。

  

总结

  在科技行业,每天都会有新的东西出现,所以我们需要关注最新的科技动态,不断学习。任何通用技术都是先学习理论,然后在实践中不断完善的过程。

  如果觉得自己的阅读效率太慢,可以在网上搜集一些课程。

  快速学习的能力,解决问题的能力,沟通的能力,真的是这个行业很重要的指标。

  善于使用StackOverFlow和Google帮助你解决学习过程中遇到的问题。

  以上是我们对大数据学习的总结。我们需要有编程基础。我们需要有扎实的编程基础和经验,自学相对比刚开始容易。那么对大数据感兴趣或者想进入这个行业的可以学习一下。

  大数据学习群:8688 47735一起学习共享资源

大数据工程师的职业素养,大数据软件工程师需要知识嘛,大数据工程师需要具备哪些能力