Spark大資料處理技術

全球首部全面介紹Spark及Spark生态圈相關技術的技術書籍

俯覽未來大局，不失精細剖析，呈現一個現代大資料架構的架構原理和實作細節

透徹講解Spark原理和架構，以及部署模式、排程架構、存儲管理及應用監控等重要子產品

Spark生态圈深度檢閱：SQL處理Shark和Spark SQL、流式處理Spark Streaming、圖計算Graphx及記憶體檔案系統Tachyon

内容簡介

書籍

計算機書籍

《Spark大資料處理技術》以Spark 0.9版本為基礎進行編寫，是一本全面介紹Spark及Spark生态圈相關技術的書籍，是國内首本深入介紹Spark原理和架構的技術書籍。主要内容有 Spark基礎功能介紹及内部重要子產品分析，包括部署模式、排程架構、存儲管理以及應用監控；同時也詳細介紹了Spark生态圈中其他的軟體和子產品，包括 SQL處理引擎Shark和Spark SQL、流式處理引擎Spark Streaming、圖計算架構Graphx以及分布式記憶體檔案系統Tachyon。《Spark大資料處理技術》從概念和原理上對Spark核心架構和生态圈做了詳細的解讀，并對Spark的應用現狀和未來發展做了一定的介紹，旨在為大資料從業人員和Spark愛好者提供一個更深入學習的平台。

《Spark大資料處理技術》适合任何大資料、Spark領域的從業人員閱讀，同時也為架構師、軟體開發工程師和大資料愛好者展現了一個現代大資料架構的架構原理和實作細節。相信通過學習《Spark大資料處理技術》，讀者能夠熟悉和掌握Spark這一目前流行的大資料架構，并将其投入到生産實踐中去。

作譯者

夏俊鸾現任阿裡巴巴資料平台部進階技術專家，Apache Spark項目Committer，曾就職于英特爾亞太研發中心，微網誌賬号@Andrew-Xia。

劉旭晖現任蘑菇街資料平台資深架構師（花名天火），曾就職于英特爾亞太研發中心大資料軟體部，Spark/Hadoop/Hbase/Phoenix 等衆多大資料相關開源項目的積極貢獻者。樂于分享，著有CSDN部落格 blog.csdn.net/colorant。

邵賽賽英特爾亞太研發有限公司開發工程師，專注于大資料領域，開源愛好者，現從事Spark相關工作，Spark代碼貢獻者。

程浩英特爾大資料技術團隊軟體工程師，Shark和Spark SQL活躍開發者，緻力于SQL on Big Data的性能調優與優化。

史鳴飛英特爾亞太研發有限公司大資料軟體部工程師，專注于大資料領域，主要從事Spark及相關項目的開發及應用，Spark及Shark代碼貢獻者，現在主要投身于Tachyon項目的開發。

黃潔目前就職于英特爾亞太研發中心大資料技術中心，擔任進階軟體工程師，緻力于大資料技術的性能優化及開發工作，涉及Hadoop、Spark、HBase等開源項目。在多年的工作過程中，積累了一定的分布式大資料架構性能調優經驗，并且是Apache Chukwa項目的PMC成員和Committer。在此之前，畢業于上海交通大學并獲碩士及學士學位。

Spark大資料處理技術

内容簡介

作譯者

目錄

繼續閱讀

人工智能如何有效地運用于自然語言處理

尚矽谷—韓順平—圖解 Java設計模式（結構型）（55～）

Storm編譯打包過程中遇到的一些問題及解決方法

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

EGORefreshTableHeaderView 解讀代碼解讀 ELTableViewController 的使用寫在最後

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

9.spark Core 進階2--Cashe

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

淺談企業活動中進行資料分析的重要性

無人機--飛控科普

android 主線程的相關問題

Ambari介紹和架構原理

NOSQL安全攻擊

win10本地scala和spark安裝安裝scala安裝spark