4实战阶段不用多说,学习完任何一门技术,最后的实战训练是最重要的,进行一些实际项目的操作练手,可以帮助我们更好的理解所学的内容,同时对于相关知识也能加强记忆,在今后的运用中,也可以更快的上手,对于相关知识该怎么用也有了经验科多大数据拥有大量实际的大数据项目的,在大数据课程学习的。
要了解常用数理统计模型描述统计指标聚类决策树贝叶斯分类回归等,重点放在学习模型的工作原理输入内容和输出内容,至于具体的数学推导,学不会可暂放一边,需要用的时候再回来看\x0d\x0a三学习初级工具20小时\x0d\x0a对于非技术类数据分析人员,初级工具只推荐一个EXCEL。
记住学到这里可以作为你学大数据的一个节点Zookeeper这是个万金油,安装Hadoop的HA的时候就会用到它,以后的Hbase也会用到它它一般用来存放一些相互协作的信息,这些信息比较小一般不会超过1M,都是使用它的软件对它有依赖,对于我们个人来讲只需要把它安装正确,让它正常的run起来就可以了Mysql。
学大数据,在前期主要是打基础,包括java基础和Linux基础,而后才会正式进入大数据技术的阶段性学习Linux学习主要是为了搭建大数据集群环境做准备,所以以Linux系统命令和shell编程为主要需要掌握的内容而Java,主要是Java SE,涉及到比较多需要掌握的内容,包括掌握java语言中变量,控制结构,循环,面向对象。
第二模块大数据框架 Hadoop重点学,毕竟大数据是以Hadoop起家的,里面就HDFS,MapReduces,YARN三个模块Hive先学会怎么用,当作一个工具来学习Spark重点学,用来替代Hadoop的MapReduces的,里面重点有三块Spark Core,Spark SQL,Spark StreamingFlink我还没学Hbase当作一个工具来学习。
要学习大数据你至少应该知道什么是大数据,大数据一般运用在什么领域对大数据有一个大概的了解,你才能清楚自己对大数据究竟是否有兴趣,如果对大数据一无所知就开始学习,有可能学着学着发现自己其实不喜欢,这样浪费了时间精力,可能还浪费了金钱所以如果想要学习大数据,需要先对大数据有一个大概的了解。