Spark 之 standalone 模式多個application（作業）資源排程

2023-04-25 08:02:33

1、預設情況
2、修改配置

1、預設情況

standalone叢集對于同時送出上來的多個作業，僅僅支援FIFO排程政策，也就是先入先出；預設情況下，叢集對多個作業同時執行的支援是不好的，沒有辦法同時執行多個作業；因為先送出上來的每一個作業都會嘗試使用叢集中所有可用的cpu資源，此時相當于就是隻能支援作業串行起來，一個一個運作了。

2、修改配置

我們希望能夠支援多作業同時運作，那麼就需要調整一下資源參數，我們可以設定spark.cores.max參數，來限制每個作業能夠使用的最大的cpu core數量，這樣先送出上來的作業不會使用所有的cpu資源，後面送出上來的作業就可以擷取到資源，也可以同時并行運作了。可以通過設定全局的一個參數，讓每個作業最多隻能擷取到一部分cpu core資源，那麼後面送出上來的作業，就也可以擷取到一部分資源，standalone叢集才可以支援同時執行多個作業。

方式一：

使用SparkConf或spark-submit中的--conf辨別，設定參數即可；

SparkConf conf = new SparkConf()

.set("spark.cores.max", "10")

通常不建議使用SparkConf，寫死，來設定一些屬性，不夠靈活。

方式二:

建議使用spark-submit來設定屬性

--conf spark.cores.max=10

方式三：

通過spark-env.sh配置每個application預設能使用的最大cpu數量來進行限制，預設是無限大，此時就不需要每個application都自己手動設定了，在spark-env.sh中配置spark.deploy.defaultCores即可。

比如說: export SPARK_MASTER_OPTS="-Dspark.deploy.defaultCores=10"

Spark 之 standalone 模式多個application（作業）資源排程

繼續閱讀

Spark在windows環境裡跑時報錯找不到org.apache.hadoop.fs.FSDataInputStream

ASP程式設計經典例子

qt中隐藏滑鼠

ASP程式設計中20個非常有用的例子

ASP程式設計中15個非常有用的例子

Spark流式分析系統實作流式實時日志分析系統

Scala和Java二種方式實戰Spark Streaming開發

Spark基礎:Spark簡介及特點,運作模式,安裝Spark,Driver與Executor,Local模式,Standalone模式,Yarn模式,Mesos模式,WordCount案例,HA配置第1章 Spark概述第2章 Spark運作模式第3章案例實操

Spark實作wordcount

C++的背影——C++之父Bjarne Stroustrup印象

C++ 的背影{C++之父Bjarne Stroustrup印象　左輕侯}

C#多線程——前台線程和背景線程

PHP進階學習之session寫入資料庫

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

大資料排錯SparkSpark叢集啟動時候，JAVA_HOME is not sethadoop叢集，某台伺服器jps無任何輸出IDEAkafkahadoopspark sqlfile permissionsIDEA本地測試 - OutOfMemoryError: GC overhead limit exceededhdfs負載均衡

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結