CDH6.3.2集成spark-sql完整版本

2023-06-09 16:26:04

地址:https://archive.apache.org/dist/spark/spark-2.4.0/spark-2.4.0-bin-hadoop2.7.tgz

cp -r /etc/spark/conf/ /opt/cloudera/parcels/CDH/lib/spark2/conf/

复制hive-site.xml文件到/opt/cloudera/parcels/CDH/lib/spark2/conf中

cp /etc/Hadoop/conf/hive-site.xml /opt/cloudera/parcels/CDH/lib/spark2/conf

spark-defaults.conf中配置项

上传spark运行依赖jar包到hdfs相应目录中：

hdfs dfs -put /opt/cloudera/parcels/CDH/lib/spark2/jars/* /user/spark/jars/

修改对应配置项

spark.yarn.jars=hdfs://master1:8020/user/spark/jars/*

cd /opt/cloudera/parcels/CDH/bin

cp spark-shell spark-sql

vim spark-sql

CDH6.3.2集成spark-sql完整版本

Alternatives –install /usr/bin/spark-sql spark-sql /opt/cloudera/parcels/CDH/bin/spark-sql 1

cp /opt/cloudera/parcels/CDH/lib/spark/jars/spark-lineage_2.11-2.4.0-cdh6.3.2.jar

/opt/cloudera/parcels/CDH/lib/spark2/jars --支持血缘分析jar包，不加会报错

scp -r ./conf.cloudera.yarn/ [email protected]:/etc/hadoop/

CDH6.3.2集成spark-sql完整版本

继续阅读