深入了解Spark：核心思想與源碼分析. 3.11　ContextCleaner的建立與啟動

2021-11-08 01:58:10

<b>3.11　contextcleaner的建立與啟動</b>

contextcleaner用于清理那些超出應用範圍的rdd、shuffledependency和broadcast對象。由于配置屬性spark.cleaner.referencetracking預設是true，是以會構造并啟動contextcleaner，代碼如下。

private[spark] val cleaner:

option[contextcleaner] = {

if (conf.getboolean("spark.cleaner.referencetracking", true))

{

some(new contextcleaner(this))

}

else {

none

}

cleaner.foreach(_.start())

contextcleaner的組成如下：

referencequeue：緩存頂級的anyref引用；

referencebuffer：緩存anyref的虛引用；

listeners：緩存清理工作的監聽器數組；

cleaningthread：用于具體清理工作的線程。

contextcleaner的工作原理和listenerbus一樣，也采用監聽器模式，由線程來處理，此線程實際隻是調用keepcleaning方法。keepcleaning的實作見代碼清單3-48。

代碼清單3-48　keep cleaning的實作

private def keepcleaning(): unit =

utils.loguncaughtexceptions {

while (!stopped) {

try {

val reference =

option(referencequeue.remove(contextcleaner.ref_queue_poll_timeout))

.map(_.asinstanceof[cleanuptaskweakreference])

// synchronize here to avoid being interrupted on stop()

synchronized {

reference.map(_.task).foreach {

task =>

logdebug("got cleaning

task " + task)

referencebuffer -=

reference.get

task match {

case cleanrdd(rddid) =>

docleanuprdd(rddid,

blocking = blockoncleanuptasks)

case

cleanshuffle(shuffleid) =>

docleanupshuffle(shuffleid, blocking = blockonshufflecleanuptasks)

cleanbroadcast(broadcastid) =>

docleanupbroadcast(broadcastid, blocking = blockoncleanuptasks)

}

} catch {

case ie: interruptedexception if stopped => // ignore

case e: exception => logerror("error in cleaning thread",

深入了解Spark：核心思想與源碼分析. 3.11　ContextCleaner的建立與啟動

繼續閱讀

redis的選擇和定位redis的選擇和定位

Redis單線程模型和IO多路複用

一篇文章讓你精通Java JSP規範

世界因大資料而改變

Spark的RDD轉換算子-雙value型Spark的RDD轉換算子-雙value型

vue-loader-v16/package.json報錯

ZooKeeper ： Curator架構之資料緩存與監聽CuratorCache

SparkSQL項目練習1 準備資料2 需求：各區域熱門商品Top3

延雲行業搜尋資料庫在大資料生态中位置和重要性大資料的挑戰大資料技術的現狀延雲行業搜尋資料庫

Spark在windows環境裡跑時報錯找不到org.apache.hadoop.fs.FSDataInputStream

Spark流式分析系統實作流式實時日志分析系統

Scala和Java二種方式實戰Spark Streaming開發

Spark基礎:Spark簡介及特點,運作模式,安裝Spark,Driver與Executor,Local模式,Standalone模式,Yarn模式,Mesos模式,WordCount案例,HA配置第1章 Spark概述第2章 Spark運作模式第3章案例實操

Spark實作wordcount

大資料排錯SparkSpark叢集啟動時候，JAVA_HOME is not sethadoop叢集，某台伺服器jps無任何輸出IDEAkafkahadoopspark sqlfile permissionsIDEA本地測試 - OutOfMemoryError: GC overhead limit exceededhdfs負載均衡

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

深入了解Spark：核心思想與源碼分析. 3.11 ContextCleaner的建立與啟動

繼續閱讀

深入了解Spark：核心思想與源碼分析. 3.11　ContextCleaner的建立與啟動