0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一系列最好的Hadoop書籍,幫助你更輕松的上手這項技術(shù)

電子工程師 ? 來源:lp ? 2019-03-01 14:44 ? 次閱讀

很多人都認為大數(shù)據(jù)應用程序是IT行業(yè)的未來,Hadoop是開發(fā)大數(shù)據(jù)應用程序最常用的技術(shù)之一。Hadoop 最早誕生于 2006 年,并在2008年成為Apache頂級項目,至今,Hadoop已經(jīng)走過了12個年頭,這對于任何軟件的生命周期來說是很長的。

雖然早有唱衰Hadoop的聲音,但許多國內(nèi)外企業(yè)的大數(shù)據(jù)平臺用到了非常多的 Hadoop 生態(tài)組件,因此,Hadoop技術(shù)并非老矣。話說回來,學習Hadoop并使用它并不容易,要掌握這項技術(shù)并成為一名成功的開發(fā)人員,你可能需要一些好書來助你一臂之力

在本文,我收集了一系列最好的Hadoop書籍,這些書籍可以幫助你更輕松的上手這項技術(shù):

1、《Hadoop: The Definitive Guide》

本書對于那些需要分析數(shù)據(jù)集和建立Hadoop集群的程序員來說,絕對是一本理想指南,它將教你如何使用Apache Hadoop構(gòu)建和維護可靠的、可伸縮的分布式系統(tǒng)。還有一些關(guān)于YARN的章節(jié)以及與Hadoop相關(guān)的幾個項目(包括 Parquet, Flume, Crunch, and Spark),你將可以通過本書挖掘Hadoop構(gòu)建分布式數(shù)據(jù)集的強大功能。

2、《Hadoop Explained》

本書主要向讀者介紹Hadoop的基本概念,通過本書你將學到的有:

Hadoop組件的基礎(chǔ)知識

如何使用MapReduce

Yarn基礎(chǔ)知識

使用HDFS Federation

Hadoop的優(yōu)勢

Hadoop如何處理大數(shù)據(jù)

3、《Programming Hive》

這是一本全面的指南,通過它你將了解Hive在Hadoop生態(tài)系統(tǒng)中的工作方式,并了解如何在你的環(huán)境中設(shè)置和配置Hive。它還提供了真實的案例研究,幫助你解決大數(shù)據(jù)相關(guān)的疑難雜癥。

4、《Modern Big Data Processing with Hadoop》

本書對Hadoop組件進行了一個全面的解釋,使你能夠使用Hadoop設(shè)計、構(gòu)建和執(zhí)行有效的大數(shù)據(jù)分析。如果你想成為一名Hadoop架構(gòu)專家,這將是你必讀的一本書,通過它你將學到:

企業(yè)數(shù)據(jù)架構(gòu)原則

Hadoop與Apache Spark、Elasticsearch等多種大數(shù)據(jù)框架結(jié)合使用

使用Apache Ambari設(shè)置和部署大數(shù)據(jù)環(huán)境

使用Spark開發(fā)大規(guī)模數(shù)據(jù)處理解決方案

理解Hadoop管理和集群部署

5、《Hadoop Security》

美亞評分4.5。如果你更關(guān)注Hadoop的安全性,那么你應該閱讀這本書,它展示了在安全漏洞發(fā)生時,如何制止攻擊者破壞和修改數(shù)據(jù)的解決辦法,從本書你將學到:

如何構(gòu)建安全的Hadoop集群硬件

了解Kerberos網(wǎng)絡(luò)身份驗證協(xié)議

數(shù)據(jù)提取和客戶端訪問安全性

6、《Data Analytics with Hadoop》

美亞評分4.0。本書同樣是介紹Hadoop生態(tài)圈技術(shù)的指南書籍,它向你展示了如何利用Hadoop在大數(shù)據(jù)集上使用統(tǒng)計和機器學習技術(shù)。你將從這本書中學到

理解Hadoop和集群計算的基本概念

使用Spark進行內(nèi)存計算

使用Apache Hive和HBase執(zhí)行數(shù)據(jù)挖掘和存儲

使用高級API進行分析

使用Spark的MLlib進行機器學習

7、《Expert Hadoop Administration》

美亞評分4.3。對于希望在任何環(huán)境中創(chuàng)建、配置、保護、管理和優(yōu)化Hadoop集群的Hadoop管理員來說,本書絕對是一本很棒的書。這本書解釋了復雜的Hadoop環(huán)境,并向你展示了在管理集群時背后的原理,并對問題和解決方案進行詳細的解釋。

8、《Architecting Modern Data Platforms》

美亞評分滿分5分。如果你是一位希望構(gòu)建端到端企業(yè)數(shù)據(jù)平臺的企業(yè)架構(gòu)師或數(shù)據(jù)工程師,那么,這本書將是你的必備指南。這本書將教你如何將Hadoop這樣的大數(shù)據(jù)技術(shù)應用到你的大數(shù)據(jù)應用程序當中去,并學會在本地和云中構(gòu)建大數(shù)據(jù)平臺

9、《Practical Hive》

美亞評分滿分5分。對于希望將關(guān)系數(shù)據(jù)庫遷移到Hadoop的人來說,這本書絕對是必讀書籍,本書由數(shù)據(jù)庫專家和大數(shù)據(jù)專家共同撰寫,具體內(nèi)容包括:Hive的安裝和配置,其核心組件和架構(gòu),Hive數(shù)據(jù)操作語言,如何加載、查詢和分析數(shù)據(jù),Hive的性能調(diào)優(yōu)以及安全性,等等。

10、《Hadoop 2.x Administration Cookbook》

這是一本入門書籍,它將通過示例逐步解釋如何將數(shù)據(jù)導入和導出到Hive,并使用Oozie管理工作流。它還提供了實用的方法來保護Hadoop集群,并使其高度可用。通過它,入門Hadoop應該是沒有什么大問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1208

    瀏覽量

    24754
  • Hadoop
    +關(guān)注

    關(guān)注

    1

    文章

    90

    瀏覽量

    15995
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8900

    瀏覽量

    137591

原文標題:書來了 | 2019年了,12歲的Hadoop還值得你學習么?

文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    2024 TI高壓研討會精彩回顧

    使用高壓系統(tǒng)的過程往往伴隨著一系列獨特的技術(shù)挑戰(zhàn);如何應對這些挑戰(zhàn)、如何設(shè)計高效、可靠且安全的高壓應用成為高壓技術(shù)發(fā)展過程中的重要話題。近期,2024 TI 高壓研討會順利舉行。期間,德州儀器
    的頭像 發(fā)表于 11-25 15:29 ?403次閱讀

    名單公布!【書籍評測活動NO.47】HarmonyOS NEXT啟程:零基礎(chǔ)構(gòu)建純血鴻蒙應用

    。 然而,許多開發(fā)者面臨個問題:如何快速上手HarmonyOS NEXT開發(fā)? 市場上對這一系統(tǒng)的全面、系統(tǒng)化的開發(fā)指導書籍相對匱乏,開發(fā)者往往需要大量的時間和精力進行自學,缺乏清晰
    發(fā)表于 10-14 14:36

    Altera推出一系列FPGA軟、硬件和開發(fā)工具

    近期,英特爾子公司Altera推出了一系列FPGA軟、硬件和開發(fā)工具,使其可編程解決方案更易應用于廣泛的用例和市場。Altera在年度開發(fā)者大會上公布了下代能效與成本優(yōu)化的Agilex 3 FPGA情況,并宣布針對Agilex 5 FPGA提供新的開發(fā)套件和軟件支持。
    的頭像 發(fā)表于 10-12 10:47 ?559次閱讀

    基于Kepware的Hadoop大數(shù)據(jù)應用構(gòu)建-提升數(shù)據(jù)價值利用效能

    背景 Hadoop個由Apache基金會所開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu),它允許用戶在不需要深入了解分布式底層細節(jié)的情況下,開發(fā)分布式程序。Hadoop充分利用集群的威力進行高速運算和存儲,特別適用于
    的頭像 發(fā)表于 10-08 15:12 ?177次閱讀
    基于Kepware的<b class='flag-5'>Hadoop</b>大數(shù)據(jù)應用構(gòu)建-提升數(shù)據(jù)價值利用效能

    地瓜機器人發(fā)布一系列通用機器人套件

    在“機器人+”浪潮的推動下,地瓜機器人近日隆重推出了一系列面向未來的軟硬件產(chǎn)品組合,旨在賦能新代通用機器人的發(fā)展。此次發(fā)布的亮點包括旭日5智能計算芯片、RDK X5機器人開發(fā)者套件以及全場景算力核心RDK S100,共同構(gòu)成了地瓜機器人在“機器人+”時代的強大
    的頭像 發(fā)表于 09-25 15:56 ?366次閱讀

    【「倉頡編程快速上手」閱讀體驗】+初步讀后感

    《倉頡編程快速上手》這本書給我留下了深刻的印象。 首先,書籍的排布清晰明了,章節(jié)劃分合理,讓人在閱讀過程中能夠輕松地找到所需內(nèi)容。無論是按照順序閱讀還是選擇性地查閱特定部分,都十分便捷。 其次
    發(fā)表于 09-10 11:09

    Nexperia擴展一系列創(chuàng)新應用專用MOSFET

    MOSFET參數(shù)組來更好地匹配這些要求。例如,應用可能要求軟啟動、擴展的安全工作區(qū)域、可靠的線性模式性能或增強的保護。在Nexperia,我們將久經(jīng)驗證的MOSFET專業(yè)知識和廣泛的應用認知相結(jié)合,打造了一系列更豐富的應用專用MOSFET。
    的頭像 發(fā)表于 07-15 16:07 ?519次閱讀

    TLV246x一系列低功耗軌到軌輸入/輸出運算放大器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TLV246x一系列低功耗軌到軌輸入/輸出運算放大器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 06-18 11:40 ?0次下載
    TLV246x<b class='flag-5'>一系列</b>低功耗軌到軌輸入/輸出運算放大器數(shù)據(jù)表

    廣和通攜一系列AIoT解決方案亮相COMPUTEX 2024

    近日,臺北國際電腦展COMPUTEX 2024盛大開幕,廣和通攜一系列前沿AIoT解決方案亮相,再次展示了其在物聯(lián)網(wǎng)和人工智能領(lǐng)域的深厚實力與獨特洞察力。
    的頭像 發(fā)表于 06-07 16:31 ?638次閱讀

    IBM開源AI模型,推動AI企業(yè)化應用

    IBM近日宣布,將把一系列先進的人工智能模型以開源軟件的形式發(fā)布,此舉標志著人工智能技術(shù)在企業(yè)應用上的新篇章。公司表示,隨著watsonx平臺推出滿年,該平臺將迎來重大更新,新增的數(shù)據(jù)和自動化功能將使企業(yè)能夠
    的頭像 發(fā)表于 05-22 09:25 ?504次閱讀

    易飛揚推出一系列創(chuàng)新硅光模塊

    在AI數(shù)據(jù)中心技術(shù)飛速發(fā)展的當下,易飛揚緊跟行業(yè)趨勢,宣布推出一系列創(chuàng)新硅光模塊。這些基于7nm DSP技術(shù)、功耗僅為16W的800G OSFP DR8/DR8+/DR8++及800G OSFP 2×FR4/2×LR4
    的頭像 發(fā)表于 05-10 10:45 ?590次閱讀

    新思科技為AMBA CHI-G協(xié)議量身定制一系列AMBA協(xié)議解決方案

    新思科技提供了一系列AMBA協(xié)議解決方案,用于早期建模、設(shè)計、實現(xiàn)、驗證、確認和系統(tǒng)成型。
    的頭像 發(fā)表于 04-30 17:20 ?832次閱讀

    優(yōu)恩半導體推出一系列適用于高速數(shù)據(jù)信號ESD和EOS的保護器件

    作為業(yè)界領(lǐng)先的保護器件供應商,優(yōu)恩半導體直致力于為客戶提供高性能保護器件及可靠的保護解決方案。針對高速數(shù)據(jù)信號接口,推出一系列超低容ESD和EOS保護器件,
    的頭像 發(fā)表于 04-28 14:13 ?583次閱讀
    優(yōu)恩半導體推出<b class='flag-5'>一系列</b>適用于高速數(shù)據(jù)信號ESD和EOS的保護器件

    ARM推出一系列汽車SoC IP,RISC-V壓力又大了

    ARM在美國時間3月13日推出一系列汽車SoC IP,包括比英偉達H100還強的CPU內(nèi)核架構(gòu)Neoverse V3AE,
    的頭像 發(fā)表于 03-20 16:02 ?1123次閱讀
    ARM推出<b class='flag-5'>一系列</b>汽車SoC IP,RISC-V壓力又大了

    阿里云在海外市場發(fā)布一系列AI大數(shù)據(jù)產(chǎn)品

    近日,阿里云宣布面向海外市場發(fā)布一系列AI計算及大數(shù)據(jù)產(chǎn)品,進步擴大其在全球市場的份額。這一系列新產(chǎn)品涵蓋了serverless模式的AI服務平臺、整合向量引擎技術(shù)的大數(shù)據(jù)產(chǎn)品等,旨
    的頭像 發(fā)表于 02-05 11:30 ?1088次閱讀