|NO.Z.00104|——————————|BigDataEnd|——|Hadoop&Spark.V02|

一、靜态記憶體管理

### --- 靜态記憶體管理
### --- 靜态記憶體架構

~~~     Spark 2.0 以前版本采用靜态記憶體管理機制。存儲記憶體、
~~~     執行記憶體和其他記憶體的大小在 Spark 應用程式運作期間均為固定的，
~~~     但使用者可以應用程式啟動前進行配置，堆内記憶體的配置設定如下圖所示：

|NO.Z.00104|——————————|BigDataEnd|——|Hadoop&Spark.V02|

### --- 靜态記憶體管理

~~~     可用的存儲記憶體 = systemMaxMemory * spark.storage.memoryFraction * spark.storage.safetyFraction
~~~     可用的執行記憶體 = systemMaxMemory * spark.shuffle.memoryFraction *
~~~     spark.shuffle.safetyFractionsystemMaxMemory 為目前 JVM 堆内記憶體的大小
~~~     這個預留的保險區域僅僅是一種邏輯上的規劃，
~~~     在具體使用時 Spark 并沒有差別對待，和”其它記憶體”一樣交給了 JVM去管理。
~~~     堆外記憶體配置設定較為簡單，隻有存儲記憶體和執行記憶體。
~~~     可用的執行記憶體和存儲記憶體占用的空間大小直接由參數spark.memory.storageFraction 決定。
~~~     由于堆外記憶體占用的空間可以被精确計算，無需再設定保險區域。

### --- 靜态記憶體管理

~~~     靜态記憶體管理機制實作起來較為簡單，但如果使用者不熟悉 Spark 的存儲機制，
~~~     或沒有根據具體的資料規模和計算任務或做相應的配置，
~~~     很容易造成”一半海水，一半火焰”的局面，即存儲記憶體和執行記憶體中的一方剩餘大量的空間，
~~~     而另一方卻早早被占滿，不得不淘汰或移出舊的内容以存儲新的内容。
~~~     由于新的記憶體管理機制的出現，這種方式目前已經很少有開發者使用，
~~~     出于相容舊版本的應用程式的目的，Spark 仍然保留了它的實作。

二、統一記憶體管理

### --- 統一記憶體管理
### --- 統一記憶體管理的堆外記憶體結構如下圖所示：

~~~     Spark 2.0 之後引入統一記憶體管理機制，
~~~     與靜态記憶體管理的差別在于存儲記憶體和執行記憶體共享同一塊空間，
~~~     可以動态占用對方的空閑區域，統一記憶體管理的堆内記憶體結構如下圖所示：

### --- 其中最重要的優化在于動态占用機制，其規則如下：
### --- 統一記憶體管理執行過程

~~~     設定基本的存儲記憶體和執行記憶體區域（spark.storage.storageFraction 參數），
~~~     該設定确定了雙方各自擁有的空間的範圍
~~~     雙方的空間都不足時，則存儲到硬碟；若己方空間不足而對方空餘時，
~~~     可借用對方的空間;（存儲空間不足指不足以放下一個完整的 Block）
~~~     執行記憶體的空間被對方占用後，可讓對方将占用的部分轉存到硬碟，然後”歸還”借用的空間
~~~     存儲記憶體的空間被對方占用後，無法讓對方”歸還”，
~~~     因為需要考慮 Shuffle 過程中的很多因素，實作起來較為複雜

### --- 統一記憶體管理執行過程

~~~     在執行過程中：執行記憶體的優先級 > 存儲記憶體的優先級（了解）
~~~     憑借統一記憶體管理機制，Spark 在一定程度上提高了堆内和堆外記憶體資源的使用率，
~~~     降低了開發者維護 Spark 記憶體的難度，但并不意味着開發者可以高枕無憂。
~~~     如果存儲記憶體的空間太大或者說緩存的資料過多，反而會導緻頻繁的全量垃圾回收，
~~~     降低任務執行時的性能，因為緩存的 RDD 資料通常都是長期駐留記憶體的。
~~~     是以要想充分發揮 Spark 的性能，
~~~     需要開發者進一步了解存儲記憶體和執行記憶體各自的管理方式和實作原理。

Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of life.It sinks, and I am ready to depart

|NO.Z.00104|——————————|BigDataEnd|——|Hadoop&Spark.V02|

繼續閱讀

資料結構學習（二）指針和記憶體那些事兒

Spark的RDD轉換算子-雙value型Spark的RDD轉換算子-雙value型

SQL Server 性能調優（方法論）【轉】

SQL Server性能調優：資源管理之記憶體管理篇

SparkSQL項目練習1 準備資料2 需求：各區域熱門商品Top3

2.4 linux存儲管理-越界通路

延雲行業搜尋資料庫在大資料生态中位置和重要性大資料的挑戰大資料技術的現狀延雲行業搜尋資料庫

Spark在windows環境裡跑時報錯找不到org.apache.hadoop.fs.FSDataInputStream

Spark流式分析系統實作流式實時日志分析系統

2022秋招cpp相關面試總結（長期更新）1、記憶體對齊2、類的占用空間死鎖elf優化bin檔案c語言和c++中const差別sizeof原理malloc一塊記憶體free怎麼找到頭尾

Scala和Java二種方式實戰Spark Streaming開發

Spark基礎:Spark簡介及特點,運作模式,安裝Spark,Driver與Executor,Local模式,Standalone模式,Yarn模式,Mesos模式,WordCount案例,HA配置第1章 Spark概述第2章 Spark運作模式第3章案例實操

Spark實作wordcount

C語言實作連結清單在作業系統中的記憶體配置設定與回收，高效記憶體管理

大資料排錯SparkSpark叢集啟動時候，JAVA_HOME is not sethadoop叢集，某台伺服器jps無任何輸出IDEAkafkahadoopspark sqlfile permissionsIDEA本地測試 - OutOfMemoryError: GC overhead limit exceededhdfs負載均衡

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

|NO.Z.00104|——————————|BigDataEnd|——|Hadoop&amp;Spark.V02|

繼續閱讀

|NO.Z.00104|——————————|BigDataEnd|——|Hadoop&Spark.V02|