天天看點

10本大資料領域經典好書,助力你的學習

  學習大資料并不是一蹴而就的事情,即使是工作多年的開發工程師都需要不斷補充新鮮的知識内容。目前學習大資料知識可以通過視訊和圖書兩種方式學習,視訊的優勢在于能夠将老師的個人開發經驗傳授給學習者,而圖書的優勢在于能夠随時翻閱,内容比較豐富。

  這裡為大家推薦零基礎學習大資料的10本經典圖書,希望同學們能夠通過不同的學習途徑充分掌握大資料開發技能。

  大資料學習10本經典圖書推薦

  1、《大資料時代》

  《大資料時代》是國外大資料系統研究的先河之作,本書作者維克托·邁爾·舍恩伯格被譽為“大資料商業應用一人”,擁有在哈佛大學、牛津大學、耶魯大學和新加坡國立大學等多個網際網路研究重鎮任教的經曆,早在2010年就在《經濟學人》上釋出了長達14頁對大資料應用的前瞻性研究。《大資料時代》認為大資料的核心就是預測。大資料将為人類的生活創造前所未有的可量化的次元。書中展示了谷歌、微軟、IBM、蘋果、facebook、twitter、VISA等大資料先鋒們具價值的應用案例。作者圍繞“要全體不要抽樣、要效率不要絕對精确、要相關不要因果”三大理念,通過數十個商業和學術案例,剖析了萬事萬物資料化和資料複用挖掘的巨大價值。

  2、《一本書讀懂大資料》

  進入大資料時代,讓資料開口說話将成為司空見慣的事情,本書将從大資料時代的前因後果講起,全面分析大資料時代的特征、企業實踐的案例、大資料的發展方向、未來的機遇和挑戰等内容,展現一個客觀立體、自由開放的大資料時代。

  3、《Hadoop權威指南》

  Hadoop是大資料技術中的核心内容之一。本書内容豐富,展示了如何使用Hadoop建構可靠、可伸縮的分布式系統,程式員可從中探索如何分析海量資料集,管理者可以了解如何建立與運作Hadoop叢集。

  4、《Hive程式設計指南》

  Hive是基于Hadoop的一個資料倉庫工具。一本ApacheHive的程式設計指南,旨在介紹如何使用Hive的SQL方法,通過大量的執行個體,首先介紹如何在使用者環境下安裝和配置Hive,并對Hadoop和MapReduce進行詳盡闡述,示範Hive如何在Hadoop生态系統進行工作。

  5、《HBase權威指南》

  HBase是一個分布式的面向列的開源資料庫。如何通過使用與HBase高度內建的Hadoop将HBase的可伸縮性變得簡單;把大型資料集分布到相對廉價的商業伺服器叢集中;了解HBase架構的細節,包括存儲格式、預寫日志、背景程序等;在HBase中內建MapReduce架構;了解如何調節叢集、設計模式、拷貝表、導入批量資料和删除節點等。

  6、《Flink入門與實戰》

  Flink是一款開源處流處理架構,其河西是Java和Scala程式設計的分布式流資料流引擎。這是一本Flink入門級圖書,力求詳細而完整地描述Flink基礎理論與實際操作,旨在幫助讀者從零開始快速掌握Flink的基本原理與核心功能。

  7、《Kafka入門與實踐》

  Kafka是一種高吞吐量的分布式釋出訂閱消息系統,它可以處理消費者在網站中的所有動作流資料。本書是基于Kafka 0.10.1.1版本,深入剖析Kafka源碼與架構。書中的大量執行個體來源于作者在實際工作中的實踐,具有現實指導意義。

  8、《Spark快速大資料分析》

  這是一本為Spark 初學者準備的書,它沒有過多深入實作細節,而是更多關注

二手QQ購買平台

上層使用者的具體用法。不過,本書絕不僅僅限于Spark 的用法,它對Spark 的核心概念和基本原理也有較為全面的介紹,讓讀者能夠知其然且知其是以然。

  9、《大資料技術全解:基礎、設計、開發與實踐》

  可以作為計算機軟體專業的大學生和研究所學生的大資料技術教材,也可作為大資料技術開發教育訓練、大資料系統咨詢規劃教育訓練的教材,更是大資料領域内一線的需求分析人員、系統分析人員、進階開發人員和開發管理人員的必備參考書。重點不在于對大資料技術的原理性介紹,而是從實戰角度出發,系統地闡述如何基于hadoop開源軟體為客戶設計、安裝和開發一個大資料系統。《大資料技術全解:基礎、設計、開發與實踐》還着重分享了具體實踐中的一些案例,不僅對于從事大資料系統開發的it技術人員具有珍貴的參考價值,而且對準備實施大資料系統項目的企業級客戶也具有指導作用。

  10、《大資料項目實戰》

  本書定位在實戰系統學習大資料技術實作,是有傳智播客教育黑馬程式員系統編撰。本書旨在令讀者具備Hadoop生态系統的分析能力,并能夠建構強大的解決方案來執行大資料分析,同時毫不費力地從大資料分析結果中獲得敏銳的洞察力。本書涉及Java語言、Hadoop、Hive、Sqoop的綜合運用,同時實作了大資料分析的可視化結果。本書适合Hadoop的初學者閱讀,也可以作為高等院校相關課程的教學參考書。讀者不僅能夠通過項目實戰鞏固基礎知識的學習效果,還能學習商業智能系統的開發過程。全書共分為6章,分别是項目概述、搭建大資料叢集環境、資料采集、資料預處理、資料分析與資料可視化。

  以上10本書基本覆寫了目前大資料領域的大部分的常用技術,無論是對于零基礎入門大資料,還是初級大資料開發工程師都是非常有用的。