Spark 基于 Standalone 模式提交任务

2022-07-01 17:22:04

1.Standalone-client 提交任务方式

提交命令:

[root@node4 bin]# ./spark-submit --master spark://node1:7077 --class org.apache.spark.examples.SparkPi /opt/spark-2.3.1/examples/jars/spark-examples_2.11-2.3.1.jar 100
[root@node4 bin]# ./spark-submit --master spark://node1:7077 --deploy-mode client --class org.apache.spark.examples.SparkPi /opt/spark-2.3.1/examples/jars/spark-examples_2.11-2.3.1.jar 100
#两种提交都行

执行原理图解

执行流程：

client 模式提交任务后，会在客户端启动 Driver 进程。
Driver 会向 Master 申请启动 Application 启动的资源。
Master 收到请求之后会在对应的 Worker 节点上启动 Executor
Executor 启动之后，会注册给 Driver 端，Driver 掌握一批计算资源。
Driver 端将 task 发送到 worker 端执行。worker 将 task 执行结果返回到 Driver 端。

特点：当在客户端提交多个Spark application时，每个application都会启动一个Driver

总结：client 模式适用于测试调试程序。Driver 进程是在客户端启动的，这里的客户端就是指提交应用程序的当前节点。在 Driver 端可以看到 task 执行的情况。生产环境下不能使用 client 模式，是因为：假设要提交 100 个，application 到集群运行，Driver 每次都会在 client 端启动，那么就会导致客户端 100 次网卡流量暴增的问题。client 模式适用于程序测试，不适用于生产环境，在客户端可以看到 task 的执行和结果

2.Standalone-cluster 提交任务方式

提交命令

[root@node4 bin]# ./spark-submit --master spark://node1:7077 --deploy-mode cluster --class org.apache.spark.examples.SparkPi /opt/spark-2.3.1/examples/jars/spark-examples_2.11-2.3.1.jar 100

执行原理图解

执行流程

cluster 模式提交应用程序后，会向 Master 请求启动 Driver.
Master 接受请求，随机在集群一台节点启动 Driver 进程。
Driver 启动后为当前的应用程序申请资源。
Driver 端发送 task 到 worker 节点上执行。
worker 将执行情况和执行结果返回给 Driver 端。

Driver 负责应用程序资源的申请。
任务的分发。
结果的回收。
监控 task 执行情况。

Spark 基于 Standalone 模式提交任务

1.Standalone-client 提交任务方式

2.Standalone-cluster 提交任务方式

继续阅读

在线教育巨头多邻国Duolingo入华一周年，中国市场马力全开

【分类算法】什么是分类算法定义分类与聚类分类过程方法

申请评分模型拒绝推断（RI）方法申请评分模型拒绝推断（RI）方法

Sql优化一：sql语句优化

Nacos 2.0 升级前后性能对比压测

尚硅谷—韩顺平—图解 Java设计模式（结构型）（55～）

Storm编译打包过程中遇到的一些问题及解决方法

MapReduce的几个企业级经典面试案例MapReduce的几个企业级经典面试案例

9.spark Core 进阶2--Cashe

大数据排错SparkSpark集群启动时候，JAVA_HOME is not sethadoop集群，某台服务器jps无任何输出IDEAkafkahadoopspark sqlfile permissionsIDEA本地测试 - OutOfMemoryError: GC overhead limit exceededhdfs负载均衡

2021-2025年中国运动疗法（KT）带行业市场供需与战略研究报告

浅谈企业活动中进行数据分析的重要性

Ambari介绍和架构原理

spark/scala关于【资源文件】加载方法概述外部文件加载方案测试资源文件打包入jar包中小结

NOSQL安全攻击

win10本地scala和spark安装安装scala安装spark