Spark Standalone 模式部署案例-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

Spark Standalone 模式部署案例

阅读量：6430 次

发布时间：2019-06-23

本文共 6457 字，大约阅读时间需要 21 分钟。

先决条件：

环境

rhel 7.2

jdk-8u102-linux-x64

spark-2.0.2-bin-hadoop2.7

Scala 2.11，注意：2.11.x 版本是不兼容的，见官网：。

准备 master 主机和 worker 分机

server1 机器：10.8.26.197，master

server2 机器：10.8.26.196，worker

server3 机器：10.8.26.195，worker

修改 host

[root@server1 ~]# vim /etc/hosts127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4::1         localhost localhost.localdomain localhost6 localhost6.localdomain610.8.26.197   server110.8.26.196   server210.8.26.195   server3

关闭所有节点机防火墙

# systemctl status firewalld# systemctl stop firewalld# systemctl disable firewalld

启动集群

主节点

./sbin/start-master.sh

查看输出日志：

cat logs/spark....[root@server1 spark-2.0.2-bin-hadoop2.7]# cat logs/spark-root-org.apache.spark.deploy.master.Master-1-server1.outSpark Command: /usr/local/jdk1.8.0_102/bin/java -cp /usr/local/spark-2.0.2-bin-hadoop2.7/conf/:/usr/local/spark-2.0.2-bin-hadoop2.7/jars/* -Xmx1g org.apache.spark.deploy.master.Master --host server1 --port 7077 --webui-port 8080========================================Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties16/12/26 10:35:34 INFO Master: Started daemon with process name: 8671@server116/12/26 10:35:34 INFO SignalUtils: Registered signal handler for TERM16/12/26 10:35:34 INFO SignalUtils: Registered signal handler for HUP16/12/26 10:35:34 INFO SignalUtils: Registered signal handler for INT16/12/26 10:35:35 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable16/12/26 10:35:35 INFO SecurityManager: Changing view acls to: root16/12/26 10:35:35 INFO SecurityManager: Changing modify acls to: root16/12/26 10:35:35 INFO SecurityManager: Changing view acls groups to:16/12/26 10:35:35 INFO SecurityManager: Changing modify acls groups to:16/12/26 10:35:35 INFO SecurityManager: SecurityManager: authentication disabled; ui acls disabled; users  with view permissions: Set(root); groups with view permissions: Set(); users  with modify permissions: Set(root); groups with modify permissions: Set()16/12/26 10:35:36 INFO Utils: Successfully started service 'sparkMaster' on port 7077.16/12/26 10:35:36 INFO Master: Starting Spark master at spark://server1:707716/12/26 10:35:36 INFO Master: Running Spark version 2.0.216/12/26 10:35:36 INFO Utils: Successfully started service 'MasterUI' on port 8080.16/12/26 10:35:36 INFO MasterWebUI: Bound MasterWebUI to 0.0.0.0, and started at http://10.8.26.197:808016/12/26 10:35:36 INFO Utils: Successfully started service on port 6066.16/12/26 10:35:36 INFO StandaloneRestServer: Started REST server for submitting applications on port 606616/12/26 10:35:37 INFO Master: I have been elected leader! New state: ALIVE

通过 master-ip:8080 访问 master 的 web UI

spark-setup

各 worker 节点

./sbin/start-slave.sh spark://server1:7077

节点输出日志：

cat logs/spark....[root@server2 spark-2.0.2-bin-hadoop2.7]# cat logs/spark-root-org.apache.spark.deploy.worker.Worker-1-server2.outSpark Command: /usr/local/jdk1.8.0_102/bin/java -cp /usr/local/spark-2.0.2-bin-hadoop2.7/conf/:/usr/local/spark-2.0.2-bin-hadoop2.7/jars/* -Xmx1g org.apache.spark.deploy.worker.Worker --webui-port 8081 spark://server1:7077========================================Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties16/12/26 10:43:04 INFO Worker: Started daemon with process name: 7466@server216/12/26 10:43:04 INFO SignalUtils: Registered signal handler for TERM16/12/26 10:43:04 INFO SignalUtils: Registered signal handler for HUP16/12/26 10:43:04 INFO SignalUtils: Registered signal handler for INT16/12/26 10:43:05 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable16/12/26 10:43:05 INFO SecurityManager: Changing view acls to: root16/12/26 10:43:05 INFO SecurityManager: Changing modify acls to: root16/12/26 10:43:05 INFO SecurityManager: Changing view acls groups to:16/12/26 10:43:05 INFO SecurityManager: Changing modify acls groups to:16/12/26 10:43:05 INFO SecurityManager: SecurityManager: authentication disabled; ui acls disabled; users  with view permissions: Set(root); groups with view permissions: Set(); users  with modify permissions: Set(root); groups with modify permissions: Set()16/12/26 10:43:06 INFO Utils: Successfully started service 'sparkWorker' on port 47422.16/12/26 10:43:06 INFO Worker: Starting Spark worker 10.8.26.196:47422 with 1 cores, 1024.0 MB RAM16/12/26 10:43:06 INFO Worker: Running Spark version 2.0.216/12/26 10:43:06 INFO Worker: Spark home: /usr/local/spark-2.0.2-bin-hadoop2.716/12/26 10:43:06 INFO Utils: Successfully started service 'WorkerUI' on port 8081.16/12/26 10:43:06 INFO WorkerWebUI: Bound WorkerWebUI to 0.0.0.0, and started at http://10.8.26.196:808116/12/26 10:43:06 INFO Worker: Connecting to master server1:7077...16/12/26 10:43:07 INFO TransportClientFactory: Successfully created connection to server1/10.8.26.197:7077 after 109 ms (0 ms spent in bootstraps)16/12/26 10:43:07 INFO Worker: Successfully registered with master spark://server1:7077

通过 master-ip:8080 访问 master 的 web UI

spark-setup

通过 worker-ip:8081 访问 worker 的 web UI

spark-setup

提交应用程序到集群

集成 shell 测试环境

切换至 bin 目录

[root@server1 spark-2.0.2-bin-hadoop2.7]# cd bin

进入运行在集群上的 spark 的集成调试环境。

Python

[root@server1 bin]# ./pyspark --master spark://server1:7077Python 2.7.5 (default, Nov  6 2016, 00:28:07)[GCC 4.8.5 20150623 (Red Hat 4.8.5-11)] on linux2Type "help", "copyright", "credits" or "license" for more information.Using Spark's default log4j profile: org/apache/spark/log4j-defaults.propertiesSetting default log level to "WARN".To adjust logging level use sc.setLogLevel(newLevel).16/12/26 10:59:10 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicableWelcome to      ____              __     / __/__  ___ _____/ /__    _\ \/ _ \/ _ `/ __/  '_/   /__ / .__/\_,_/_/ /_/\_\   version 2.0.2      /_/Using Python version 2.7.5 (default, Nov  6 2016 00:28:07)SparkSession available as 'spark'.

以统计文本行数为例：

>>> textFile=sc.textFile("../README.md")>>> textFile.count()99

输出 README.md 中共有 99 行

scala

[root@server1 spark-2.0.2-bin-hadoop2.7]# ./bin/spark-shell --master spark://server1:7077scala> val textFile=sc.textFile("README.md")textFile: org.apache.spark.rdd.RDD[String] = README.md MapPartitionsRDD[9] at textFile at 
    
     :24scala> textFile.count()res0: Long = 99

可以在 master 的 web 界面里面看到任务执行情况

spark-setup

也可以在 worker 的 web 界面里面看单个 worker 的情况

spark-setup

转载地址：http://bbiga.baihongyu.com/

你可能感兴趣的文章

iOS9 未受信任的企业级开发者

paper 40 ：鲁棒性robust

做一个会使用PS的前端开发

优化MySchool数据库（事务、视图、索引）

硬件开发之pcb---PCB抗干扰设计原则

关于字符串循环遍历的两种方法

使用笔记:TF辅助工具--tensorflow slim(TF-Slim)

CCF-NOIP-2018 提高组(复赛) 模拟试题(一)

大话设计模式读书笔记3——单例模式

Java多线程之ReentrantLock与Condition

Vue 项目构建

[Ruby on Rails系列]2、开发环境准备：Ruby on Rails开发环境配置

在反射中如何调用类中的Setter()AndGetter()方法

android studio adb

框架源码系列二：手写Spring-IOC和Spring-DI（IOC分析、IOC设计实现、DI分析、DI实现）...

asp.net编译懒人脚本

二分答案经典入门题:)

为什么你需要将代码迁移到ASP.NET Core 2.0？

思杰的雄心——软件定义的工作空间

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-01-16 04:48:23 当前IP: 3.144.30.14 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我