天天看点

《Spark权威指南》的翻译综述

本文源地址:《Spark权威指南》的翻译综述

《Spark权威指南》的翻译综述

前言

本系列文章将对《Spark - The Definitive Guide - Big data processing made simple》进行翻译,参照其他译本,取名为:《Spark权威指南》,翻译工作全程由我个人独自翻译,属于对照式翻译,有助于读者理解,如有不当或错误之处,欢迎不吝指出,方便你我他。

本书英文版出版信息

2018年2月第一版

《Spark权威指南》的翻译综述

翻译进度

Part I. Gentle Overview of Big Data and Spark

  • 翻译:《Spark权威指南》第3章:Spark工具一览

Part II. Structured APIs—DataFrames, SQL, and Datasets

  • 翻译:《Spark权威指南》第4章:结构化API概览
  • 翻译:《Spark权威指南》第5章:基本结构化的操作
  • 翻译:《Spark权威指南》第6章:处理不同的数据类型
  • 翻译:《Spark权威指南》第7章:聚合
  • 翻译:《Spark权威指南》第8章:连接
  • 翻译:《Spark权威指南》第9章:数据源
  • 翻译:《Spark权威指南》第10章:Spark SQL
  • 翻译:《Spark权威指南》第11章:Dataset

Part III. Low-Level APIs

  • 翻译:《Spark权威指南》第12章:RDD
  • 翻译:《Spark权威指南》第13章:高级RDD
  • 翻译:《Spark权威指南》第14章:分布式共享变量

Part IV. Production Application

  • 翻译:《Spark权威指南》第15章:Spark如何在集群上的运行
  • 翻译:《Spark权威指南》第16章:开发Spark应用程序
  • 翻译:《Spark权威指南》第17章:部署Spark应用程序
  • 翻译:《Spark权威指南》第18章:监控和调试
  • 翻译:《Spark权威指南》第19章:性能调优

Part V. Streaming

  • 翻译:《Spark权威指南》第20章:流处理基础
  • 翻译:《Spark权威指南》 第21章 结构化流基础
  • 翻译:《Spark权威指南》第22章:事件时间和状态处理
  • 翻译:《Spark权威指南》第23章:生产环境中的结构化流

Part VI. Advanced Analytics and Machine Learning

  • 翻译:《Spark权威指南》第24章:高级分析和机器学习概述
  • 翻译:《Spark权威指南》第25章:预处理与特征工程
  • 翻译:《Spark权威指南》第26章:分类
  • 翻译:《Spark权威指南》第27章:回归
  • 翻译:《Spark权威指南》第28章:推荐
  • 翻译:《Spark权威指南》第29章:无监督学习

还有第1,2,30章未翻译,近期太忙,择日翻译。

本书的勘误

Errata | O’Reilly Mediawww.oreilly.com

Last but not least

如果你觉得本系列文章对你有帮助亦或愿意对我的开源付出进行支持,可以对我的本系列文章打赏,毕竟开源不易,由衷感谢你的关注与支持!!!

继续阅读