天天看點

大公司都在做的大資料平台,為你精選這一份書單

現如今每個公司都有自己的大資料平台和大資料團隊,可以看出大資料建設在公司的重要地位,不管是用于做資料分析、BI還是做用于機器學習、人工智能等領域,大資料都是基礎,海量資料成為了網際網路公司的重要資産。

今天這一份書單,我們将推薦幾本綜合介紹大資料平台和技術棧的優質書籍,幫各位對大資料技術感興趣的小夥伴快速入門和學習大資料。

大資料技術棧系列書單

大資料技術原理與應用

(1) 概念篇:介紹目前緊密關聯的*新IT領域技術雲計算、大資料和物聯網。

(2) 大資料存儲與管理篇:介紹分布式資料存儲的概念、原理和技術,包括HDFS、HBase、NoSQL資料庫、雲資料庫。

(3) 大資料處理與分析篇:介紹MapReduce分布式程式設計架構、基于記憶體的分布式計算架構Spark、圖計算、流計算、資料可視化。

(4) 大資料應用篇:介紹基于大資料技術的推薦系統。

作者簡介

林子雨,北大博士,廈門大學計算機科學系老師,中國高校**"數字教師"的提出者和建設者。在資料庫、資料倉庫、資料挖掘、大資料、雲計算和物聯網等領域有着十多年的知識積累,對各個領域知識都有比較深入的了解,有比較寬泛的視野。

大資料平台基礎架構指南

目前不乏大資料具體技術元件的書籍,但卻很少有從大資料平台整體建設和産品形态的宏觀角度入手來闡釋的。

本書重點介紹大資料開發平台服務建構的整體思路和解決方案,内容涵蓋一個成熟的大資料開發平台必不可少的各類核心元件:工作流排程系統、內建開發環境、中繼資料管理系統、資料交換服務、資料可視化服務、資料品質管理服務,以及測試環境的建設等。

書中還凝結了作者多年平台建設的實踐經驗,以及對大資料相關從業人員能力建設和職業規劃的寶貴建議。本書适合廣大志在深入了解大資料平台建設、開發和應用的在職人員及院校師生。

劉旭晖,花名天火,蘑菇街資料平台資深架構師,負責蘑菇街大資料服務平台整體産品規劃和架構設計工作;此前多年供職于Intel開源技術中心,是Spark/Hadoop/HBase/Phoenix等開源項目貢獻者;在核心驅動、作業系統中間件、輸入法、浏覽器等方向均有多年開發經驗。

大資料架構詳解:從資料擷取到深度學習

本書從架構、業務、技術三個次元深入淺出地介紹了大資料處理領域端到端的知識。主要内容包括三部分:第一部分從資料的産生、采集、計算、存儲、消費端到端的角度介紹大資料技術的起源、發展、關鍵技術點和未來趨勢,結合生動的業界新産品,以及學術界新的研究方向和成果,讓深奧的技術淺顯易懂;第二部分從業務和技術角度介紹實際案例,讓讀者了解大資料的用途及技術的本質;第三部分介紹大資料技術不是孤立的,講解如何與前沿的雲技術、深度學習、機器學習等相結合。

朱潔,2008年加入華為,具有8年大資料研發管理經驗,現任華為大資料服務首席規劃師。專注于大資料服務平台建設、規劃和實踐應用,同時參與多項企業級大資料項目解決方案的規劃、設計和實施工作,在深化大資料行業落地方面有諸多實踐經驗,對解讀大資料垂直行業的技術創新與開發有諸多獨到的見解和心得。

羅華霖,2002年加入華為,華為大資料首席規劃師,主導完成華為大資料平台DataSight和華為電信大資料解決方案SmartCare技術規劃和架構設計,支援電信營運商數字化戰略轉型,完成浙江移動、上海聯通、沙特STC等200+電信大資料解決方案項目落地。曾任華為軟交換首席設計師,華為大型電信大資料解決方案SmartCare首席架構師。