《深入理解Spark:核心思想与源码分析》——第2章Spark设计理念与基本架构

2021-11-08 13:09:59

本节书摘来自华章社区《深入理解spark:核心思想与源码分析》一书中的第2章spark设计理念与基本架构，作者耿嘉安，更多章节内容可以访问云栖社区“华章社区”公众号查看

第2章

spark设计理念与基本架构

若夫乘天地之正，而御六气之辩，以游无穷者，彼且恶乎待哉？

—《庄子·逍遥游》

本章导读

上一章，介绍了spark环境的搭建，为方便读者学习spark做好准备。本章首先从spark产生的背景开始，介绍spark的主要特点、基本概念、版本变迁。然后简要说明spark的主要模块和编程模型。最后从spark的设计理念和基本架构入手，使读者能够对spark有宏观的认识，为之后的内容做一些准备工作。

spark是一个通用的并行计算框架，由加州伯克利大学（ucberkeley）的amp实验室开发于2009年，并于2010年开源，2013年成长为apache旗下大数据领域最活跃的开源项目之一。spark也是基于map reduce 算法模式实现的分布式计算框架，拥有hadoop mapreduce所具有的优点，并且解决了hadoop mapreduce中的诸多缺陷。

《深入理解Spark:核心思想与源码分析》——第2章Spark设计理念与基本架构

继续阅读

浅谈企业活动中进行数据分析的重要性

ubuntu14.04下安装hbse1.0.1.1

笔试面试题目：滑动窗口(二)

Apache配置SSLApache配置SSL

Windows下配置Apache的SSL服务

User Defined Hadoop DataType

数据结构与算法（27）——排序（二）

Apache2.4.x 配置文件详解Apache配置需要了解如下：开始讲解：

配置apache支持PHP（win7）

Dijkstra--简易版（最短路径）

Ambari介绍和架构原理

GitHub连夜封杀！这份阿里 10W 字内部 Java 字面试手册到底有多强？

spark/scala关于【资源文件】加载方法概述外部文件加载方案测试资源文件打包入jar包中小结

NOSQL安全攻击

win10本地scala和spark安装安装scala安装spark

hdu7108哈希