Spark 之 standalone 模式多个application（作业）资源调度

2023-04-25 08:02:33

1、默认情况
2、修改配置

1、默认情况

standalone集群对于同时提交上来的多个作业，仅仅支持FIFO调度策略，也就是先入先出；默认情况下，集群对多个作业同时执行的支持是不好的，没有办法同时执行多个作业；因为先提交上来的每一个作业都会尝试使用集群中所有可用的cpu资源，此时相当于就是只能支持作业串行起来，一个一个运行了。

2、修改配置

我们希望能够支持多作业同时运行，那么就需要调整一下资源参数，我们可以设置spark.cores.max参数，来限制每个作业能够使用的最大的cpu core数量，这样先提交上来的作业不会使用所有的cpu资源，后面提交上来的作业就可以获取到资源，也可以同时并行运行了。可以通过设置全局的一个参数，让每个作业最多只能获取到一部分cpu core资源，那么后面提交上来的作业，就也可以获取到一部分资源，standalone集群才可以支持同时执行多个作业。

方式一：

使用SparkConf或spark-submit中的--conf标识，设置参数即可；

SparkConf conf = new SparkConf()

.set("spark.cores.max", "10")

通常不建议使用SparkConf，硬编码，来设置一些属性，不够灵活。

方式二:

建议使用spark-submit来设置属性

--conf spark.cores.max=10

方式三：

通过spark-env.sh配置每个application默认能使用的最大cpu数量来进行限制，默认是无限大，此时就不需要每个application都自己手动设置了，在spark-env.sh中配置spark.deploy.defaultCores即可。

比如说: export SPARK_MASTER_OPTS="-Dspark.deploy.defaultCores=10"

Spark 之 standalone 模式多个application（作业）资源调度

继续阅读

Spark在windows环境里跑时报错找不到org.apache.hadoop.fs.FSDataInputStream

ASP编程经典例子

qt中隐藏鼠标

ASP编程中20个非常有用的例子

ASP编程中15个非常有用的例子

Spark流式分析系统实现流式实时日志分析系统

Scala和Java二种方式实战Spark Streaming开发

Spark基础:Spark简介及特点,运行模式,安装Spark,Driver与Executor,Local模式,Standalone模式,Yarn模式,Mesos模式,WordCount案例,HA配置第1章 Spark概述第2章 Spark运行模式第3章案例实操

Spark实现wordcount

C++的背影——C++之父Bjarne Stroustrup印象

C++ 的背影{C++之父Bjarne Stroustrup印象　左轻侯}

C#多线程——前台线程和后台线程

PHP进阶学习之session写入数据库

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制规程及特点4． CSMA/CD协议5． CSMA/CD的优点6．结束语

大数据排错SparkSpark集群启动时候，JAVA_HOME is not sethadoop集群，某台服务器jps无任何输出IDEAkafkahadoopspark sqlfile permissionsIDEA本地测试 - OutOfMemoryError: GC overhead limit exceededhdfs负载均衡

spark/scala关于【资源文件】加载方法概述外部文件加载方案测试资源文件打包入jar包中小结