当前位置:   article > 正文

Linux虚拟机环境搭建spark_linux spark安装

linux spark安装

Linux环境搭建Spark分为两个版本,分别是Scala版本和Python版本。

一、 安装Pyspark

环境以 Python 环境为例。

1、下载spark

下载网址:https://archive.apache.org/dist/spark

下载安装包:根据自己环境选择合适版本,本环境以spark3.0版本为案例。

  1. 根据hadoop版本下载下载 spark-3.0.0-bin-hadoop2.7.tgz  / spark-3.0.0-bin-hadoop3.2.tgz
  2. 如果不依赖hadoop,则下载spark-3.0.0-bin-without-hadoop.tgz
  3. 只安装pyspark下载pyspark-3.0.0.tar.gz

个人推荐带有hadoop版本 如 spark-3.0.0-bin-hadoop3.2.tgz ,将来可以使用hadoop,也可以使用python环境。

2、上传spark安装包到目录

3、解压spark安装包并重命名

重命名主要是为了便于配置环境变量

本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/766862
推荐阅读
相关标签
  

闽ICP备14008679号