學(xué)大數(shù)據(jù)需要具備什么基礎(chǔ)?學(xué)大數(shù)據(jù)應(yīng)具備編程開發(fā)經(jīng)驗(yàn),今天主要介紹學(xué)大數(shù)據(jù)應(yīng)具備的基礎(chǔ),學(xué)員從java基礎(chǔ)開始,學(xué)習(xí)大數(shù)據(jù)開發(fā)過程中的離線數(shù)據(jù)分析、實(shí)時(shí)數(shù)據(jù)分析和內(nèi)存數(shù)據(jù)計(jì)算等重要內(nèi)容;涵蓋大數(shù)據(jù)體系中核心技術(shù);Linux、Zookeeper、Hadoop、Redis、HDFS、MapReduce、Hive、Impala等知識點(diǎn)。
學(xué)大數(shù)據(jù)基礎(chǔ)包含涵蓋大數(shù)據(jù)體系中的技術(shù)點(diǎn),包括但不限于Linux、Zookeeper、Hadoop、Yam、Redis、HDFS、MapReduce、Hive、lmpala、Hue、Oozie、Storm、Kafka、Spark、Soark RDD、Spark SQL、Soark Streaming、Sqoop、Flume、CDH、Scala、Hbase、Flink、機(jī)器學(xué)習(xí)等,將離線數(shù)據(jù)分析、實(shí)時(shí)數(shù)據(jù)分析和內(nèi)存數(shù)據(jù)計(jì)算中的技術(shù)點(diǎn)全面覆蓋。
學(xué)大數(shù)據(jù)需要具備的基礎(chǔ):
1、Linux
大數(shù)據(jù)相關(guān)軟件都在Linux上運(yùn)行,學(xué)好Linux快速掌握大數(shù)據(jù)相關(guān)技術(shù)會有很大的幫助,更好理解hadoop、hive、hbase、spark等大數(shù)據(jù)軟件的運(yùn)行環(huán)境和網(wǎng)絡(luò)環(huán)境配置,少踩坑,學(xué)會shell就能看懂腳本這樣能更容易理解和配置大數(shù)據(jù)集群。
2、Hadoop
大數(shù)據(jù)代名詞,Hadoop包括幾個(gè)組件HDFS、MapReduce和YARN,HDFS是存儲數(shù)據(jù)的地方就像我們電腦的硬盤一樣文件都存儲在這個(gè)上面,MapReduce是對數(shù)據(jù)進(jìn)行處理計(jì)算的,有個(gè)特點(diǎn)就是不管多大的數(shù)據(jù)只要給時(shí)間就能把數(shù)據(jù)跑完,但時(shí)間可能不是很快所以叫數(shù)據(jù)的批處理。
3、Zookeeper
安裝Hadoop的HA的時(shí)候就會用,Hbase也會用到。用來存放一些相互協(xié)作的信息,這些信息比較小一般不會超過1M,都是使用的軟件對有依賴,對于我們個(gè)人來講只需要把安裝正確,讓正常的run起來就可以了。
4、Mysql
學(xué)習(xí)完大數(shù)據(jù)的處理,接下來學(xué)習(xí)學(xué)習(xí)小數(shù)據(jù)的處理工具mysql數(shù)據(jù)庫,因?yàn)橐粫bhive的時(shí)候要用到,mysql需要掌握到什么層度那?你能在Linux上把安裝好,運(yùn)行起來,會配置簡單的權(quán)限,修改root的密碼,創(chuàng)建數(shù)據(jù)庫。
5、Sqoop
把Mysql里的數(shù)據(jù)導(dǎo)入到Hadoop里。直接把Mysql數(shù)據(jù)表導(dǎo)出成文件再放到HDFS上也是一樣的,當(dāng)然生產(chǎn)環(huán)境中使用要注意Mysql的壓力。
6、Hive
這個(gè)東西對于會SQL語法的來說就是神器,能讓你處理大數(shù)據(jù)變的很簡單,不會再費(fèi)勁的編寫MapReduce程序。有的人說Pig那?和Pig差不多掌握一個(gè)就可以了。
7、Oozie
管理Hive或者M(jìn)apReduce、Spark腳本,還能檢查程序是否執(zhí)行正確,出錯了給你發(fā)報(bào)警并能幫你重試程序,最重要的是還能幫你配置任務(wù)的依賴關(guān)系。
學(xué)生學(xué)習(xí)大數(shù)據(jù)的需求,包含java常見技術(shù)以及大數(shù)據(jù)流行的框架。以案例驅(qū)動教學(xué)的方式,帶領(lǐng)學(xué)習(xí)者層層深入到大數(shù)據(jù)體系的內(nèi)核當(dāng)中,通過系統(tǒng)學(xué)習(xí)使學(xué)員能夠快速系統(tǒng)的熟悉大數(shù)據(jù)的應(yīng)用場景、理解大數(shù)據(jù)技術(shù)原理、以及掌握大數(shù)據(jù)應(yīng)用的技術(shù)方法,讓學(xué)員能夠游刃有余的從事大數(shù)據(jù)相關(guān)工作
責(zé)編AJX
-
Linux
+關(guān)注
關(guān)注
87文章
11304瀏覽量
209535 -
編程
+關(guān)注
關(guān)注
88文章
3616瀏覽量
93739 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8890瀏覽量
137449
發(fā)布評論請先 登錄
相關(guān)推薦
評論