《海量資料處理與大資料技術實戰》來咯，從實戰出發，解讀大資料技術！

目前，圖書市場上關于大資料技術的圖書不少，但是，真正從實戰應用出發，同時深入剖析大資料離線批處理計算領域和線上實時計算領域常用的大資料架構技術原理、程式設計案例和架構整合的圖書卻很少。本書以實戰案例為主旨，通過詳細介紹大資料開發中常用的多種技術架構和其對應的大量開發案例，并在大資料處理實戰案例篇章，整合多種大資料技術架構實作基于海量日志資料的分析統計系統(涵蓋大資料離線批處理計算技術和大資料線上實時計算技術)，讓讀者更加全面、深入、透徹地了解大資料開發領域中各種熱門技術和主流架構的使用，提高各種大資料架構的整合能力，進而提高大資料開發水準和項目實戰能力。

點選下載下傳《海量資料處理與大資料技術實戰》

精彩内容搶先看

第一篇大資料基礎篇(第 1~3 章)

本篇主要對大資料的基礎知識、Hadoop和 Storm的基礎知識和基本技術以及應用現狀和發展趨勢進行了簡單的介紹。

第二篇大資料離線批處理技術篇(第 4~11 章)

本篇主要介紹的是大資料離線批處理計算領域所涉及的技術和架構，包括:Hadoop、 Hive 和 Sqoop。分别介紹了每種架構的基本原理和使用案例，包括:安裝 CentOS 6.8 虛拟機環境，搭建每種架構的運作環境，分别以指令行和API 方式實作 HDFS 的資料操作，以 Java 語言和 Python 語言實作多個 Hadoop MapReduce 開發案例，使用 HiveQL 操作 Hive 中的資料庫和資料表以及自定義 Hive 函數，使用 Sqoop 實作 HDFS 與 MySQL之間的資料導入導出。

第三篇大資料線上實時處理技術篇(第 12~17 章)

本篇主要介紹了大資料線上實時計算領域所涉及的技術和架構，包括:Flume、Kafka 和 Storm。分别介紹了每種架構的基本原理和使用案例，包括:搭建每種架構的運作環境， Flume 基于記憶體、檔案和目錄的 Channel，Flume 寫資料到 HDFS和 Kafka，Flume 采集 Nginx 日志到 Hive、Flume采集 Nginx 日志到多個目标系統，自定義 Flume 的Agent，Flume 監控，分别使用 Java 語言和 Python 語言實作 Kafka 用戶端程式設計，使用 Storm 實作單詞計數、追加字元串、聚合多種資料流、實作分組聚合和實作事務處理，實作Storm 監控等。

第四篇大資料處理實戰案例篇(第 18~22 章)

本篇主要詳解介紹了基于海量日志資料的分析統計系統的開發過程，介紹了系統的項目背景。在實作上将系統分為離線批處理計算子系統和線上實時計算子系統，分别介紹了兩個子系統的需求、架構設計、功能設計、存儲選型、技術選型、環境搭建和具體的系統實作過程。

複制該連結到浏覽器完成下載下傳或分享：

https://developer.aliyun.com/topic/download?id=8205

《海量資料處理與大資料技術實戰》是大資料開發領域中以實戰案例為主旨的經典之作。本書全面闡述了大資料開發領域中常用的技術原理和架構，以及架構對應的實戰案例。全書共分為四大篇章:大資料基礎篇、大資料離線批處理技術篇、大資料線上實時處理技術篇、大資料處理實戰案例篇。大資料基礎篇主要介紹了大資料的基礎知識、Hadoop 和 Storm 的基礎知識以及發展現狀和應用前景;大資料離線批處理技術篇主要介紹了 Hadoop、Hive 和 Sqoop 的基本原理、環境搭建和項目案例;大資料線上實時處理技術篇主要介紹了 Flume、Kafka、Storm 的基本原理、環境搭建和項目案例;大資料處理實戰案例篇詳細介紹了基于海量日志資料的分析統計系統的實作過程，期間對各種大資料架構進行了整合，此案例項目稍加修改，便可應用于實際開發項目中。

本書内容由淺入深、從原理到實戰，适合在校大學生、專業教育訓練機構的學員、想轉行從事大資料開發的人員、需要系統學習大資料技術的開發人員、大資料從業者、大資料運維工程師、希望提高大資料開發實戰水準的人員、大資料開發經理、大資料架構師、需要時常查閱大資料常用架構技術和開發案例的人員閱讀。

阿裡雲開發者藏經閣

彙聚阿裡巴巴技術實踐精華，涵蓋雲原生、物聯網、大資料、AI等技術領域，深度分享阿裡工程師實戰經驗，頂級技術内容一手掌握。

點選進入藏經閣，暢遊技術海洋。

《海量資料處理與大資料技術實戰》來咯，從實戰出發，解讀大資料技術！

繼續閱讀

Java String.format方法的簡單使用

neo4j之cypher使用文檔

Ambari介紹和架構原理

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

【python】【資料處理】畫多元資料分布圖

NOSQL安全攻擊

mybatis_入門程式Mybatis入門

AOP程式設計_Android優雅權限架構(1)概念基礎，2021金三銀四前言正文大綱正文

sqlServer根據經緯查距離

Effective Java 8:通用程式設計

OOM三種類型

工廠模式-三種類型

【遞歸】高效率求2的n次幂

win10本地scala和spark安裝安裝scala安裝spark

scala (3) Function 和 Method