Spark技术内幕：Master的故障恢复

2021-11-05 22:47:20

spark技术内幕：master基于zookeeper的high availability（ha）源码实现详细阐述了使用zk实现的master的ha，那么master是如何快速故障恢复的呢？

处于standby状态的master在接收到org.apache.spark.deploy.master.zookeeperleaderelectionagent发送的electedleader消息后，就开始通过zk中保存的application，driver和worker的元数据信息进行故障恢复了，它的状态也从recoverystate.standby变为recoverystate.recovering了。当然了，如果没有任何需要恢复的数据，master的状态就直接变为recoverystate.alive，开始对外服务了。

一方面master通过

恢复application，driver和worker的状态，一方面通过

在60s后主动向自己发送completerecovery的消息，开始恢复数据完成后的操作。

首先看一下如何通过zookeeperleaderelectionagent提供的接口恢复数据。

获取了原来的master维护的application，driver和worker的列表后，当前的master通过beginrecovery来恢复它们的状态。

恢复application的步骤：

置待恢复的application的状态为unknown，向appclient发送masterchanged的消息

appclient收到后改变其保存的master的信息，包括url和master actor的信息，回复masterchangeacknowledged(appid)

master收到后通过appid后将application的状态置为waiting

检查如果所有的worker和application的状态都不是unknown，那么恢复结束，调用completerecovery()

恢复worker的步骤：

重新注册worker（实际上是更新master本地维护的数据结构），置状态为unknown

向worker发送masterchanged的消息

worker收到消息后，向master回复消息workerschedulerstateresponse，并通过该消息上报executor和driver的信息。

master收到消息后，会置该worker的状态为alive，并且会检查该worker上报的信息是否与自己从zk中获取的数据一致，包括executor和driver。一致的executor和driver将被恢复。对于driver，其状态被置为running。

beginrecovery的源码实现：

通过下面的流程图可以更加清晰的理解这个过程：

如何判断恢复是否结束？

在上面介绍application和worker的恢复时，提到了每次收到他们的回应，都要检查是否当前所有的worker和application的状态都不为unknown，如果是，那么恢复结束，调用completerecovery()。这个机制并不能完全起作用，如果有一个worker恰好也是宕机了，那么该worker的状态会一直是unknown，那么会导致上述策略一直不会起作用。这时候第二个判断恢复结束的标准就其作用了：超时机制，选择是设定了60s得超时，在60s后，不管是否有worker或者appclient未返回相应，都会强制标记当前的恢复结束。对于那些状态仍然是unknown的app和worker，master会丢弃这些数据。具体实现如下：

但是对于一个拥有几千个节点的集群来说，60s设置的是否合理？毕竟现在没有使用standalone模式部署几千个节点的吧？因此硬编码60s看上去也十分合理，毕竟都是逻辑很简单的调用，如果一些节点60s没有返回，那么下线这部分机器也是合理的。

通过设置spark.worker.timeout，可以自定义超时时间。

Spark技术内幕：Master的故障恢复

继续阅读

pyspark调用spark以及执行带in语句参数的hql示例

用写sql的思路写 pyspark

pyspark学习(一)—pyspark的安装与基础语法一 Pysaprk的安装二：pyspark的简单语法END

【Spark Mllib】K-均值聚类——电影类型K-均值聚类数据特征提取

一篇文章让你精通Java JSP规范

世界因大数据而改变

Spark的RDD转换算子-双value型Spark的RDD转换算子-双value型

SparkSQL项目练习1 准备数据2 需求：各区域热门商品Top3

延云行业搜索数据库在大数据生态中位置和重要性大数据的挑战大数据技术的现状延云行业搜索数据库

Spark在windows环境里跑时报错找不到org.apache.hadoop.fs.FSDataInputStream

Spark流式分析系统实现流式实时日志分析系统

Scala和Java二种方式实战Spark Streaming开发

Spark基础:Spark简介及特点,运行模式,安装Spark,Driver与Executor,Local模式,Standalone模式,Yarn模式,Mesos模式,WordCount案例,HA配置第1章 Spark概述第2章 Spark运行模式第3章案例实操

Spark实现wordcount

大数据排错SparkSpark集群启动时候，JAVA_HOME is not sethadoop集群，某台服务器jps无任何输出IDEAkafkahadoopspark sqlfile permissionsIDEA本地测试 - OutOfMemoryError: GC overhead limit exceededhdfs负载均衡

spark/scala关于【资源文件】加载方法概述外部文件加载方案测试资源文件打包入jar包中小结