天天看點

《海量資料處理與大資料技術實戰》來咯,從實戰出發,解讀大資料技術!

目前,圖書市場上關于大資料技術的圖書不少,但是,真正從實戰應用出發,同時深 入剖析大資料離線批處理計算領域和線上實時計算領域常用的大資料架構技術原理、程式設計案 例和架構整合的圖書卻很少。本書以實戰案例為主旨,通過詳細介紹大資料開發中常用的多 種技術架構和其對應的大量開發案例,并在大資料處理實戰案例篇章,整合多種大資料技術 架構實作基于海量日志資料的分析統計系統(涵蓋大資料離線批處理計算技術和大資料線上 實時計算技術),讓讀者更加全面、深入、透徹地了解大資料開發領域中各種熱門技術和主 流架構的使用,提高各種大資料架構的整合能力,進而提高大資料開發水準和項目實戰能力。

點選下載下傳 《海量資料處理與大資料技術實戰》

​​

《海量資料處理與大資料技術實戰》來咯,從實戰出發,解讀大資料技術!

精彩内容搶先看

第一篇 大資料基礎篇(第 1~3 章)

本篇主要對大資料的基礎知識、Hadoop和 Storm的基礎知識和基本技術以及應用現狀和發展趨勢進行了簡單的介紹。

第二篇 大資料離線批處理技術篇(第 4~11 章)

本篇主要介紹的是大資料離線批處理計算領域所涉及的技術和架構,包括:Hadoop、 Hive 和 Sqoop。分别介紹了每種架構的基本原理和使用案例,包括:安裝 CentOS 6.8 虛拟 機環境,搭建每種架構的運作環境,分别以指令行和API 方式實作 HDFS 的資料操作,以 Java 語言和 Python 語言實作多個 Hadoop MapReduce 開發案例,使用 HiveQL 操作 Hive 中 的資料庫和資料表以及自定義 Hive 函數,使用 Sqoop 實作 HDFS 與 MySQL之間的資料導 入導出。

第三篇 大資料線上實時處理技術篇(第 12~17 章)

本篇主要介紹了大資料線上實時計算領域所涉及的技術和架構,包括:Flume、Kafka 和 Storm。分别介紹了每種架構的基本原理和使用案例,包括:搭建每種架構的運作環境, Flume 基于記憶體、檔案和目錄的 Channel,Flume 寫資料到 HDFS和 Kafka,Flume 采集 Nginx 日志到 Hive、Flume采集 Nginx 日志到多個目标系統,自定義 Flume 的Agent,Flume 監控, 分别使用 Java 語言和 Python 語言實作 Kafka 用戶端程式設計,使用 Storm 實作單詞計數、追加 字元串、聚合多種資料流、實作分組聚合和實作事務處理,實作Storm 監控等。

第四篇 大資料處理實戰案例篇(第 18~22 章)

本篇主要詳解介紹了基于海量日志資料的分析統計系統的開發過程,介紹了系統的項 目背景。在實作上将系統分為離線批處理計算子系統和線上實時計算子系統,分别介紹了兩 個子系統的需求、架構設計、功能設計、存儲選型、技術選型、環境搭建和具體的系統實作 過程。

複制該連結到浏覽器完成下載下傳或分享:

https://developer.aliyun.com/topic/download?id=8205

《海量資料處理與大資料技術實戰》是大資料開發領域中以實戰案例為主旨的經典之作。本書全面闡 述了大資料開發領域中常用的技術原理和架構,以及架構對應的實戰案例。全書共分為四大篇章:大資料 基礎篇、大資料離線批處理技術篇、大資料線上實時處理技術篇、大資料處理實戰案例篇。大資料基礎篇 主要介紹了大資料的基礎知識、Hadoop 和 Storm 的基礎知識以及發展現狀和應用前景;大資料離線批處理 技術篇主要介紹了 Hadoop、Hive 和 Sqoop 的基本原理、環境搭建和項目案例;大資料線上實時處理技術篇 主要介紹了 Flume、Kafka、Storm 的基本原理、環境搭建和項目案例;大資料處理實戰案例篇詳細介紹了 基于海量日志資料的分析統計系統的實作過程,期間對各種大資料架構進行了整合,此案例項目稍加修改, 便可應用于實際開發項目中。

本書内容由淺入深、從原理到實戰,适合在校大學生、專業教育訓練機構的學員、想轉行從事大資料開發 的人員、需要系統學習大資料技術的開發人員、大資料從業者、大資料運維工程師、希望提高大資料開發 實戰水準的人員、大資料開發經理、大資料架構師、需要時常查閱大資料常用架構技術和開發案例的人員閱讀。

阿裡雲開發者藏經閣

彙聚阿裡巴巴技術實踐精華,涵蓋雲原生、物聯網、大資料、AI等技術領域,深度分享阿裡工程師實戰經驗,頂級技術内容一手掌握。

點選進入藏經閣,暢遊技術海洋。
《海量資料處理與大資料技術實戰》來咯,從實戰出發,解讀大資料技術!