集团站切换校区

验证码已发送,请查收短信

复制成功
微信号:togogoi
添加微信好友, 详细了解课程
已复制成功,如果自动跳转微信失败,请前往微信添加好友
打开微信
图标

业界新闻

当前位置:首页 > >业界新闻 > >

如何安装Hadoop

发布时间: 2022-03-09 15:45:23

主要介绍在CentOS 7单机环境下的Hadoop搭建过程。


1.准备Hadoop需要的软件


(1)安装Java软件包。


CentOS 7发行版本默认会安装Java运行环境,可以使用which命令来确认Java是否安装,命令如下:



也可以自行下载和安装自己需要的Java版本,建议Java版本高于7.0。


这里使用从官方网站下载的最新版本的Java开发包,下载地址:http://www.oracle.com/technetwork/cn/java/javase/downloads/index.html。


将下载好的安装包安装到指定位置,这里以保存到/opt目录下为例,操作命令如下:



设置环境变量“JAVA_HOME”,这个变量用来指定Java程序的工作目录。在/etc/bashrc目录下添加Java安装目录,命令如下:



(2)设置SSH通过秘钥方式访问。Hadoop多个节点之间通信会采用SSH秘钥认证方式,为避免每次通信都需要用户输入密码,这里需要生成一对SSH秘钥,生成秘钥使用如下命令:



(3)下载Hadoop软件包。访问http://hadoop.apache.org/releases.html#Download,这里提供了多个版本的Hadoop软件包下载,建议读者测试和开发时使用最新的稳定版本(Stable),这里以2.6.4版本为例,下载位置如图1所示。


图1 下载位置


下载完成后将Hadoop解压缩到/opt目录,并设置环境变量指向Hadoop的安装目录。命令如下:



2.修改配置文件并启动服务


(1)修改Hadoop HDFS配置文件。接下来需要设置Hadoop的配置文件,这种单机运行的模式也称作伪分布模式,和集群模式略有区别。这里使用伪分布模式进行部署。修改如下配置文件。


①$HADOOP_HOME/etc/hadoop/core-site.xml。



②$HADOOP_HOME/etc/hadoop/hdfs-site.xml。



(2)启动Hadoop HDFS服务。


①首次启动格式化存储空间。



②启动NameNode和DataNode进程。



③验证端口是否启动。



(3)修改Hadoop YARN配置文件。


①$HADOOP_HOME/etc/hadoop/mapred-site.xml。



②$HADOOP_HOME/etc/hadoop/yarn-site.xml。



(4)启动Hadoop YARN服务。


①启动命令如下:



②验证端口是否启动。



伪分布方式配置起来非常简单,多用于开发环境部署,接下来就对伪分布环境进行测试。

上一篇: Spark框架

下一篇: MapReduce原理

在线咨询 ×

您好,请问有什么可以帮您?我们将竭诚提供最优质服务!