找回密码
 立即注册
搜索

如何学习大数据

随着大数据时代的发展,越来越多的人想要学习大数据,但是又不知道从哪里末尾学起,首先在学习大数据之前你需求了解大数据到底是什么?
对于大数据,它不是某个专业也不是某一门编程言语,它是由一系列技术的组合运用。接上去我将分为几个部分来讲解需求学习什么以及为什么要学习这些。


一、在下一步的学习之前,我们要先学习Java

Java学习的部分,次要以JavaSE重点,打好Java编程基础。
Java SE的学习,大致可以参照以下道路:
对象导论:如何用面向对象的思绪来开发
深化JVM:Java运转机制以及JVM原理
面向对象的特征:封装、承继、笼统、多态
数组和容器:容器的线程安全成绩
I/O和NIO:NIO工作原理和运用
并发编程:concurrent包
网络编程:TCP/IP+BIO/NIO UDP/IP+BIO/NIO
JDBC框架和反射:JNDI、衔接池、annotation等
其他:正则表达式、字符串等
其次,是对于企业级框架的学习,常用的SSM,也就是spring、springboot、spring mvc和mybatis,需求有相应程度的了解,然后就可以进入到大数据框架的学习。


二、掌握Java后末尾学习Linux

1、什么是Linux
Linux是一种操作系统,普通市面上只要windows、Linux、Mac OS X、Unix这四种系统,而我们往常运用最多的系统是windows系统。
2、为什么要学习Linux
① 大数据相关软件都是在Linux上运转的。
② 掌握了Linux的基础,可以疾速掌握后面的大数据处理技术。
三、大数据技术框架学习

1、有哪些次要学习的技术框架
① 入门学习:CentOS、Maven
② 进阶学习:HDFS、MapReduce、Yarn、Hbase、MongoDB、Redis、Flume、Scala、Kafka、Spark、Hive
③ 扩展学习:Flink、ES、Oozie
2、为什么学习这些技术框架
① 处理大数据需求了解这些框架的作用及基本环境的搭建,并且纯熟运用这些框架可以处理大数据。
② CentOS是社区企业操作系统,一个基于Linux系统提供源代码的平台;Maven次要处理导入Java类依赖的jar,编译Java项目的次要成绩,管理jar包。学习这两个次要是为了更好的学习并上手后面的大数据技术框架。
③ Hadoop的框架最核心的设计就是:HDFS和MapReduce,HDFS为海量的数据提供了存储,MapReduce为海量的数据提供了计算。
④ Yarn是一个分布式程序的运转调度平台,有两大核心角色Resource Manager及Node Manager,前者接受用户提交的分布式计算程序,并为其划分资源并管理、监控各个Node Manager上的资源状况,以便于平衡负载;后者管控它所在机器对的运算资源,担任接受前者分配的义务,创建容器、回收资源。
⑤ Hive和Hbase基本是大数据仓库的标配,要回用、懂调优、缺点排查。
⑥ MongoDB是一种基于分布式文件存储的数据库,由C++言语编写,旨在为WEB运用提供可扩展的高功能数据存储处理方案。
⑦ Redis是一个单线程的NoSQL数据库,次要用来做数据缓存的,普通大型网站的运用和数据库之间的那一层就是Redis。
⑧ Flume是用来做数据采集的。
⑨ Kafka是一个分布式的音讯系统,可以高效并实时的吞吐数据,以及经过分布式集群及数据复制冗余机制完成数据的安全。
⑩ Spark作为大数据计算的主流第二代框架,相对于前代的MapReduce计算功能得到极大提升,在主流市场遭到重用,作为大数据开发者,对于Spark一定要深化学习,掌握透彻。
⑪ Flink设计为在一切常见的集群环境中运转,以内存速度和任何规模执行计算,适用于一切企业。
⑫ ES全称为Elasticsearch,是一个基于Lucense的搜索服务器;
⑬ Oozie是服务于Hadoop生态系统的工作流调度工具。


四、自学还是培训

1、自学普通是自控力强并且自学才能强的人的选择。
2、假如本人想要省费事是可以经过培训来学习大数据。
希望大家可以这篇文章对如何学习大数据有一些明晰的看法~

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评3

陆见深 2021-6-24 16:11:12 来自手机 显示全部楼层
边撸边过
回复

使用道具 举报

emyx 2021-6-25 14:09:18 来自手机 显示全部楼层
撸过
回复

使用道具 举报

ojgkcsv53231 2021-6-26 17:00:03 显示全部楼层
有没有什么需要注意的?
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies