深入理解Spark：核心思想与源码分析. 3.11　ContextCleaner的创建与启动

2021-11-08 01:58:10

<b>3.11　contextcleaner的创建与启动</b>

contextcleaner用于清理那些超出应用范围的rdd、shuffledependency和broadcast对象。由于配置属性spark.cleaner.referencetracking默认是true，所以会构造并启动contextcleaner，代码如下。

private[spark] val cleaner:

option[contextcleaner] = {

if (conf.getboolean("spark.cleaner.referencetracking", true))

{

some(new contextcleaner(this))

}

else {

none

}

cleaner.foreach(_.start())

contextcleaner的组成如下：

referencequeue：缓存顶级的anyref引用；

referencebuffer：缓存anyref的虚引用；

listeners：缓存清理工作的监听器数组；

cleaningthread：用于具体清理工作的线程。

contextcleaner的工作原理和listenerbus一样，也采用监听器模式，由线程来处理，此线程实际只是调用keepcleaning方法。keepcleaning的实现见代码清单3-48。

代码清单3-48　keep cleaning的实现

private def keepcleaning(): unit =

utils.loguncaughtexceptions {

while (!stopped) {

try {

val reference =

option(referencequeue.remove(contextcleaner.ref_queue_poll_timeout))

.map(_.asinstanceof[cleanuptaskweakreference])

// synchronize here to avoid being interrupted on stop()

synchronized {

reference.map(_.task).foreach {

task =>

logdebug("got cleaning

task " + task)

referencebuffer -=

reference.get

task match {

case cleanrdd(rddid) =>

docleanuprdd(rddid,

blocking = blockoncleanuptasks)

case

cleanshuffle(shuffleid) =>

docleanupshuffle(shuffleid, blocking = blockonshufflecleanuptasks)

cleanbroadcast(broadcastid) =>

docleanupbroadcast(broadcastid, blocking = blockoncleanuptasks)

}

} catch {

case ie: interruptedexception if stopped => // ignore

case e: exception => logerror("error in cleaning thread",

深入理解Spark：核心思想与源码分析. 3.11　ContextCleaner的创建与启动

继续阅读

redis的选择和定位redis的选择和定位

Redis单线程模型和IO多路复用

一篇文章让你精通Java JSP规范

世界因大数据而改变

Spark的RDD转换算子-双value型Spark的RDD转换算子-双value型

vue-loader-v16/package.json报错

ZooKeeper ： Curator框架之数据缓存与监听CuratorCache

SparkSQL项目练习1 准备数据2 需求：各区域热门商品Top3

延云行业搜索数据库在大数据生态中位置和重要性大数据的挑战大数据技术的现状延云行业搜索数据库

Spark在windows环境里跑时报错找不到org.apache.hadoop.fs.FSDataInputStream

Spark流式分析系统实现流式实时日志分析系统

Scala和Java二种方式实战Spark Streaming开发

Spark基础:Spark简介及特点,运行模式,安装Spark,Driver与Executor,Local模式,Standalone模式,Yarn模式,Mesos模式,WordCount案例,HA配置第1章 Spark概述第2章 Spark运行模式第3章案例实操

Spark实现wordcount

大数据排错SparkSpark集群启动时候，JAVA_HOME is not sethadoop集群，某台服务器jps无任何输出IDEAkafkahadoopspark sqlfile permissionsIDEA本地测试 - OutOfMemoryError: GC overhead limit exceededhdfs负载均衡

spark/scala关于【资源文件】加载方法概述外部文件加载方案测试资源文件打包入jar包中小结

深入理解Spark：核心思想与源码分析. 3.11 ContextCleaner的创建与启动

继续阅读

深入理解Spark：核心思想与源码分析. 3.11　ContextCleaner的创建与启动