0
点赞
收藏
分享

微信扫一扫

Spark2.X环境准备、编译部署及运行

程序员伟杰 2022-06-17 阅读 55

Spark2.X环境准备、编译部署及运行_spark

 

Spark2.X环境准备、编译部署及运行_spark_02

 

Spark2.X环境准备、编译部署及运行_java_03

 

 Spark2.X环境准备、编译部署及运行_spark_04

Spark2.X环境准备、编译部署及运行_java_05

 

 Spark2.X环境准备、编译部署及运行_java_06

Spark2.X环境准备、编译部署及运行_java_07

 

Spark2.X环境准备、编译部署及运行_spark_08

 

下载地址 :https://www.apache.org/dyn/closer.lua/spark/spark-2.2.0/spark-2.2.0.tgz

Spark2.X环境准备、编译部署及运行_spark_09

 

我们把spark放在节点2上

Spark2.X环境准备、编译部署及运行_spark_10

 

解压

Spark2.X环境准备、编译部署及运行_spark_11

 

Spark2.X环境准备、编译部署及运行_spark_12

Spark2.X环境准备、编译部署及运行_maven_13

Spark2.X环境准备、编译部署及运行_maven_14

 

 

下面我们把jdk换成1.8的

Spark2.X环境准备、编译部署及运行_java_15

Spark2.X环境准备、编译部署及运行_spark_16

Spark2.X环境准备、编译部署及运行_spark_17

 

配置环境变量

Spark2.X环境准备、编译部署及运行_spark_18

 

Spark2.X环境准备、编译部署及运行_java_19

 

使环境变量生效

Spark2.X环境准备、编译部署及运行_maven_20

 

 重启后

Spark2.X环境准备、编译部署及运行_spark_21

另外两个节点的做法一样,这里就不多说了

 

Spark2.X环境准备、编译部署及运行_java_22

 

上传maven包

Spark2.X环境准备、编译部署及运行_maven_23

 

解压

 Spark2.X环境准备、编译部署及运行_maven_24

 

 Spark2.X环境准备、编译部署及运行_spark_25

 

配置maven的环境变量

Spark2.X环境准备、编译部署及运行_maven_26

Spark2.X环境准备、编译部署及运行_java_27

 

#java
export JAVA_HOME=/opt/modules/jdk1.8.0_60
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin

#maven
export MAVEN_HOME=/opt/modules/apache-maven-3.3.9
export PATH=$PATH:$MAVEN_HOME/bin
export MAVEN_OPTS="-Xmx2g -XX:MaxPermSize=1024M -XX:ReservedCodeCacheSize=1024M"

 

 

使其环境变量生效

Spark2.X环境准备、编译部署及运行_maven_28

Spark2.X环境准备、编译部署及运行_maven_29

 

 

 Spark2.X环境准备、编译部署及运行_java_30

Spark2.X环境准备、编译部署及运行_spark_31

Spark2.X环境准备、编译部署及运行_spark_32

 

Spark2.X环境准备、编译部署及运行_spark_33

Spark2.X环境准备、编译部署及运行_spark_34

 

 找到这一串,把他删除掉

Spark2.X环境准备、编译部署及运行_java_35

 

改成

Spark2.X环境准备、编译部署及运行_spark_36

VERSION=2.2.0
SCALA_VERSION=2.11.8
SPARK_HADOOP_VERSION=2.6.0
SPARK_HIVE=1

 

Spark2.X环境准备、编译部署及运行_java_37

 

 Spark2.X环境准备、编译部署及运行_spark_38

 

 

 我们可以参考官网的教程说明

​​http://spark.apache.org/docs/2.2.0/building-spark.html​​

Spark2.X环境准备、编译部署及运行_java_39

 

我们运行一下

Spark2.X环境准备、编译部署及运行_spark_40

./dev/make-distribution.sh --name custom-spark --tgz -Phadoop-2.6 -Phive -Phive-thriftserver  -Pyarn

 

 这个过程非常长,网络好机器配置好的话也许一个小时吧,如果中途网络不好失败的话就重新来吧Spark2.X环境准备、编译部署及运行_spark_41

 

我自己这里也是经过了一次失败之后,再重新运行一次这条语句就可以了,当看到build success字样的时候就说明成功了

Spark2.X环境准备、编译部署及运行_maven_42

 

 Spark2.X环境准备、编译部署及运行_maven_43

 

 在spark的目录下会多了一个踏包

Spark2.X环境准备、编译部署及运行_java_44

 

解压

Spark2.X环境准备、编译部署及运行_maven_45

 

改一下名字

Spark2.X环境准备、编译部署及运行_spark_46

 Spark2.X环境准备、编译部署及运行_java_47

 

Spark2.X环境准备、编译部署及运行_spark_48

 

 

Spark2.X环境准备、编译部署及运行_spark_49

 

解压

Spark2.X环境准备、编译部署及运行_java_50

 

 

接下来配置环境变量

Spark2.X环境准备、编译部署及运行_java_51

 

Spark2.X环境准备、编译部署及运行_java_52

 

#scala
export SCALA_HOME=/opt/modules/scala-2.11.8
export PATH=$PATH:$SCALA_HOME/bin

 

 

使环境变量生效

Spark2.X环境准备、编译部署及运行_java_53

Spark2.X环境准备、编译部署及运行_maven_54

Spark2.X环境准备、编译部署及运行_maven_55

 

Spark2.X环境准备、编译部署及运行_java_56

Spark2.X环境准备、编译部署及运行_java_57

Spark2.X环境准备、编译部署及运行_spark_58

 

Spark2.X环境准备、编译部署及运行_java_59

 

 Spark2.X环境准备、编译部署及运行_maven_60

 

读取文件

 Spark2.X环境准备、编译部署及运行_spark_61

 

 统计有多少行

Spark2.X环境准备、编译部署及运行_maven_62

 

 

文件的第一行

Spark2.X环境准备、编译部署及运行_maven_63

 

前4行

Spark2.X环境准备、编译部署及运行_maven_64

 

 

Spark2.X环境准备、编译部署及运行_maven_65

 

我们先新建一个数据文件

Spark2.X环境准备、编译部署及运行_spark_66

Spark2.X环境准备、编译部署及运行_java_67

 

 

 把文件读取进来

Spark2.X环境准备、编译部署及运行_spark_68

 

 用空格切分

Spark2.X环境准备、编译部署及运行_maven_69

 

 以key value对的方式显示出来

Spark2.X环境准备、编译部署及运行_spark_70

 

 这里报错

Spark2.X环境准备、编译部署及运行_java_71

 

 

下面我们打开spark的系统监控页面

Spark2.X环境准备、编译部署及运行_spark_72

 

Spark2.X环境准备、编译部署及运行_java_73

 

 创建缓存

Spark2.X环境准备、编译部署及运行_java_74

 

 使用一下

Spark2.X环境准备、编译部署及运行_java_75

 

 这里就有反馈了Spark2.X环境准备、编译部署及运行_maven_76

 

举报

相关推荐

0 条评论