Spark的基础应用

news/2024/7/7 22:14:36

目的要求

  1. 搭建Spark集群环境;
  2. Spark集群的启动、浏览与关闭;
  3. 使用Eclipse编写Spark应用程序包;
  4. 如何运行Spark任务;

实验环境

  1. Java jdk 1.7;
  2. apache-maven-3.6.0;
  3. Eclipse;
  4. Apache_Hadoop集群;
  5. 安装配置Spark
  6. 具体规划:

主机名

IP地址

服务描述

Cluster-01

192.168.10.111

master节点

Cluster-03

192.168.10.113

Slave01节点

Cluster-04

192.168.10.114

Slave01节点

 

 

 

 

 

练习内容

任务一: Spark集群环境部署;

1、下载地址;http://spark.apache.org/downloads.html

 

2、将Spark软件上传至集群中;

3、将软件压缩包进行解压;

4、移动解压文件,并重新命名;

5、配置环境变量,使其生效;

6、配置修改spark的相关文件;

6.1、配置spark文件;

6.2、配置slaves文件;

7、配置完以上文件后,将Master主机的/home/admin/spark文件发送至其他两台主机;

 

任务二:启动Spark集群并进行验证;

1、启动hadoop集群;

1.1、启动Zookeeper服务;

    指令:$zkServer.sh start

1.2、启动Hadoop服务;

    指令:$start-all.sh

1.3查看进程:

指令:$jps

2、启动Master节点;

指令:$sbin/start-master.sh

3、启动所有的Slave节点;

指令:$sbin/start-slaves.sh

4、在浏览器上查看Spark集群的管理信息;

5、启动Spark-shell;

 

任务三:关闭Spark集群

1、首先管理spark的master节点,然后关闭spark的slaves节点,最后关闭Hadoop集群;

 

任务四:编写Spark应用程序

1、准备测试数据:hdfs: //Cluster-01:9000/user/input/hello.txt;

2、启动Spark-shell。运行WordCount词频统计程序;

 

 


http://lihuaxi.xjx100.cn/news/238344.html

相关文章

以太坊中的安全代币案例

想知道更多关于区块链技术知识,请百度【链客区块链技术问答社区】 链客 ,有问必答!我在关于安全令代币(第一部分,第二部分)有争议的文章中,我提到过,以太坊可能不是长期执行安全代币…

mysql查看正在执行的sql语句

有2个方法: 1、使用processlist,但是有个弊端,就是只能查看正在执行的sql语句,对应历史记录,查看不到。好处是不用设置,不会保存。 -- use information_schema; -- show processlist; 或者: -- …

在Unity中创建3D直升机游戏

In this lecture from Colton Ogden, you can learn game development principles by coding a Helicopter Game 3D using Unity and C#. The principles you learn can apply to any programming language and any game.在Colton Ogden的本次演讲中,您可以通过使用…

最新Java面试题答案

JAVA基础 JAVA中的几种基本类型,各占用多少字节? 下图单位是bit,非字节 1B8bit String能被继承吗?为什么? 不可以,因为String类有final修饰符,而final修饰的类是不能被继承的,实现细节不允许改…

简化区块链中的数字签名

想知道更多关于区块链技术知识,请百度【链客区块链技术问答社区】 链客,有问必答!现在我们经常在区块链中看到数字签名这一术语是非常常见的。在发送交易时,无论是比特币、Ethereum、Hyperledger Fabric还是任何其他平台&#xff…

Java基础-泛型

Java基础-泛型 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.泛型的引入 由于集合可以存储任意类型的元素,导致取出时,如果出现强转就会引发运行时异常(ClassCastException…

spring vertx_如何在Spring设置Vertx

spring vertxby Rick Lee李瑞克(Rick Lee) 如何在Spring设置Vertx (How to set up Vertx in Spring) Spring is probably the most popular framework in the Java space. We all love its dependency injection and all that autowired/configuration magic. It makes unit t…

区块链和去中心化的弱点

想知道更多关于区块链技术知识,请百度【链客区块链技术问答社区】 链客,有问必答!技术人员通常认为区块链是一种纯粹的、无损的产品。即使是那些抨击比特币的人,也会称赞区块链,仿佛这是种超越。 从某种程度上来说&…