Linux centos 配置hadoop集群

博主： TheRivers
发布时间：2022 年 01 月 04 日
742 次浏览
暂无评论
13754字数
分类： Hadoop 大数据

LinuxCentos7配置hadoop

准备条件

apache-hadoop-3.3.0 jar包
hadoop-3.3.0(点击下载)
jdk1.8
jdk1.8(点击下载)

最好还是自己去官网下载然后上传到虚拟机，如果用下面的方式可以会有网速限制，毕竟自己的小服务器，带宽有限，或者点击下方两个连接进行下载，下载之后，最后把这个的名字改成和我的对应起来，这样下面的配置就方便了。
Hadoop3.0清华源
jdk1.8清华源
另外，需要准备三台虚拟机，分别命名为hadoop1,hadoop2,hadoop3,并且将这三台虚拟机这样配置接点，原理就不多说了。

	hadoop1	hadoop2	hadoop3
HDFS	NameNode DataNode	DataNode	SecondaryNameNode DataNode
YARN	NodeManager	ResourceManager NodeManager	NodeManager

开始配置

配置/etc/hostname，更改为hadoop1。目前这些步骤只用配置一台虚拟机，之后的通过虚拟机克隆得到haoop2,hadoop3。注意，在克隆之后，仍然要修改对应的主机名。


```swift
[root@localhost ~]# yum install vim -y
#先下载vim，方便编辑查看区别
[root@localhost ~]# vim /etc/hostname
```
将这里的这行删掉，然后修改成hadoop1![在这里插入图片描述](https://img-blog.csdnimg.cn/20210326142312651.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70#pic_right)

配置/etc/hosts


```swift
[root@localhost ~]# vim /etc/hosts
```
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210326142737580.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70#pic_right)
修改成这样，先填入另两个虚拟机的地址，因为是使用克隆，所以三台虚拟机之间的ip地址相差不过，只用小作修改。修改好以后重启一下虚拟机就生效了。

配置jdk1.8

可以通过上面给的连接下载然后通过工具传到linux上面，或者使用下面这个命令下载jdk，跟着顺序来，一步步的来，别慌。

[root@hadoop1 ~]# yum install wget -y

[root@hadoop1 ~]# mkdir /java
[root@hadoop1 ~]# cd /java
[root@hadoop1 java]# wget -i -c http://ljy0427.online/install/jdk1.8-linux.tar.gz
#下载完成之后，解压
[root@hadoop1 java]# tar -zxvf jdk1.8-linux.tar.gz
#解压成功之后，重命名文件夹
[root@hadoop1 java]# mv jdk1.8.0_144 java

配置环境变量,在/etc/profile.d/目录下，自己创建一个.sh文件

[root@hadoop1 java]# vim /etc/profile.d/my_env.sh
#添加如下东西

export JAVA_HOME=/java/java
export PATH=$PATH:$JAVA_HOME/bin
添加了以后，保存退出

#重新刷新配置文件
[root@hadoop1 java]# source /etc/profile
#测试配置成功，只要出现版本号就说明配置成功了
[root@hadoop1 java]# java -version

配置hadoop

下载并解压apache-hadoop3.3.0

[root@hadoop1 java]# mkdir /opt/hadoop
[root@hadoop1 java]# cd /opt/hadoop

如果之前没有下载的话，就在这个/opt/hadoop使用下面这个命令下载吧。

[root@hadoop1 hadoop]# wget -i -c http://ljy0427.online/install/hadoop-3.3.0.tar.gz

解压这个解压包

[root@hadoop1 hadoop]# tar -zxvf hadoop-3.3.0.tar.gz
#重命名解压包
[root@hadoop1 hadoop]# mv hadoop-3.3.0 hadoop

配置hadoop环境变量

[root@hadoop1 hadoop]# vim /etc/profile.d/my_env.sh

添加如下内容
export HADOOP_HOME=/opt/hadoop/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

[root@hadoop1 hadoop]# source /etc/profile
#测试配置是否成功
[root@hadoop1 hadoop]# hadoop
#输入这个命令，看是否弹出一堆东西来

在这里插入图片描述

#之后先创建一些文件夹放着
[root@hadoop1 hadoop]# mkdir /opt/hadoop/hadoop_data
[root@hadoop1 hadoop]# mkdir /opt/hadoop/hadoop_data/tmp
[root@hadoop1 hadoop]# mkdir /opt/hadoop/hadoop_data/var
[root@hadoop1 hadoop]# mkdir /opt/hadoop/hadoop_data/dfs
[root@hadoop1 hadoop]# mkdir /opt/hadoop/hadoop_data/dfs/name
[root@hadoop1 hadoop]# mkdir /opt/hadoop/hadoop_data/dfs/data

关闭防火墙，参考下面这篇博文
关闭防火墙
关闭了防火墙之后，就可以克隆虚拟机了

在克隆之前，再来一个操作，内行人看了都直呼666的操作，看好了

创建一个脚本名字为,xsync,跟着我的顺序来，一步步的来，莫慌。

[root@hadoop1 hadoop]# mkdir /root/bin
[root@hadoop1 hadoop]# cd /root/bin
[root@hadoop1 bin]# vim xsync

在里面添加如下脚本

#!/bin/bash    
if [ $# -lt 1 ]
then 
    echo Not Enough Arguement!
    exit;
fi
#注意，如果你的主机名命名和我不一样，下面这三个更换成你的主机名
for host in hadoop1 hadoop2 hadoop3
do 
    echo =================  $host  =================      
    for file in $@
    do
        if [ -e $file ]
            then
                pdir=$(cd -P $(dirname $file); pwd)
                fname=$(basename $file)
                ssh $host "mkdir -p $pdir"
                rsync -av $pdir/$fname $host:$pdir
            else
                echo $file does not exists!                
        fi
    done
done

#创建完成之后，给这个脚本添加权限
[root@hadoop1 bin]# chmod +x xsync

#可以克隆了，克隆的时候，一定要将虚拟机关机才可以。
#克隆完成之后，每台虚拟机都需要下载下面这个工具
[root@hadoop1 bin]# yum install rsync -y

克隆完成之后，根据自己的虚拟机所分配的地址，修改三台虚拟机的/etc/hosts中的ip地址，以及/etc/hostname中的主机名

实现三台主机之间免密登录

参考我这篇博文
ssh免密登录

最好三台虚拟都使用ssh-copy-id hostname

修改hadoop的配置文件

为了保证没啥大问题，在hadoop的hadoop-env.sh中添加JAVA_HOME的路劲
```
[root@hadoop1 ~]# cd /opt/hadoop/hadoop/etc/hadoop/
[root@hadoop1 hadoop]# vim hadoop-env.sh
```
修改之前
修改之后

修改hdfs-site.xml

[root@hadoop1 hadoop]# vim hdfs-site.xml
#如果你设置的主机名和我的不同，那记得将我这个配置文件里面的hadoop1替换成你对应的主机名。

在这里插入图片描述

在<configuration> 里面添加以下东西

    <!-- 指定NameNode的web端访问地址 -->
<property>
        <name>dfs.namenode.http-address</name>
        <value>hadoop1:9870</value>
</property>
    
    <!-- 设置SecondaryNameNode(2NN)的web端访问地址 -->
<property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>hadoop3:9868</value>
</property>


<property>
   <name>dfs.name.dir</name>
   <value>/opt/hadoop/hadoop_data/dfs/name</value>
   <description>Path on the local filesystem where theNameNode stores the namespace and transactions logs persistently.</description>
</property>

<property>
   <name>dfs.data.dir</name>
   <value>/opt/hadoop/hadoop_data/dfs/data</value>
   <description>Comma separated list of paths on the localfilesystem of a DataNode where it should store its blocks.</description>
</property>

<property>
   <name>dfs.replication</name>
   <value>3</value>
</property>

<property>
      <name>dfs.permissions</name>
      <value>true</value>
      <description>need not permissions</description>
</property>

复制并且修改mapred-site.xml

[root@hadoop1 hadoop]# cp mapred-site.xml mapred-site.xml.template
[root@hadoop1 hadoop]# vim mapred-site.xml

也是一样的在<configuration> 里面添加以下东西

<!-- 指定MapReduce程序运行在Yarn上的地址 -->
<property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
 </property>
<property>
   <name>mapred.job.tracker</name>
   <value>hadoop1:49001</value>
</property>

<property>
      <name>mapred.local.dir</name>
       <value>/opt/hadoop/hadoop_data/var</value>
</property>

配置yarn-site.xml，跟上面一样，在同样的位置添加以下东西

[root@hadoop1 hadoop]# vim yarn-site.xml

<!-- 指定MapReduce走shuffle -->
<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>
<!-- 指定ResourceManager的地址 -->
<property>
    <name>yarn.resourcemanager.hostname</name>
    <value>hadoop2</value>
</property>



<property>
    <description>The address of the applications manager interface in the RM.</description>
    <name>yarn.resourcemanager.address</name>
    <value>${yarn.resourcemanager.hostname}:8032</value>
</property>

<property>
    <description>The address of the scheduler interface.</description>
    <name>yarn.resourcemanager.scheduler.address</name>
    <value>${yarn.resourcemanager.hostname}:8030</value>
</property>

<property>
    <description>The http address of the RM web application.</description>
    <name>yarn.resourcemanager.webapp.address</name>
    <value>${yarn.resourcemanager.hostname}:8088</value>
</property>

<property>
    <description>The https adddress of the RM web application.</description>
    <name>yarn.resourcemanager.webapp.https.address</name>
    <value>${yarn.resourcemanager.hostname}:8090</value>
</property>

<property>
    <name>yarn.resourcemanager.resource-tracker.address</name>
    <value>${yarn.resourcemanager.hostname}:8031</value>
</property>

<property>
    <description>The address of the RM admin interface.</description>
    <name>yarn.resourcemanager.admin.address</name>
    <value>${yarn.resourcemanager.hostname}:8033</value>
</property>


<property>
    <name>yarn.scheduler.maximum-allocation-mb</name>
    <value>2048</value>
    <discription>每个节点可用内存,单位MB,默认8182MB</discription>
</property>

<property>
    <name>yarn.nodemanager.vmem-pmem-ratio</name>
    <value>2.1</value>
</property>

<property>
    <name>yarn.nodemanager.resource.memory-mb</name>
    <value>2048</value>
</property>

<property>
    <name>yarn.nodemanager.vmem-check-enabled</name>
    <value>false</value>
</property>

配置core-site.xml,同上

[root@hadoop1 hadoop]# vim core-site.xml

    <property>

        <name>hadoop.tmp.dir</name>

        <value>/opt/hadoop/hadoop_data/tmp</value>

        <description>Abase for other temporary directories.</description>

   </property>

   <property>

        <name>fs.default.name</name>
        <!-- hadoop1的内网IP地址 -->
        <value>hdfs://hadoop1:9000</value>

   </property>

    
    
    <!-- 指定NameNode的地址 -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://hadoop1:8020</value>
    </property>

配置workers，将三个主机名添加进去。
```
[root@hadoop1 hadoop]# vim workers
```
记住必须严格按照我的效果图，主机名称后面不准有空格，只能换行！
同步这些配置文件到hadoop2,hadoop3上
到了这里，有些人已经崩溃了，还要配两次？？？
要配置两遍，那是对于别人，看好我的操作，一次就好。
前面不是创建了一个脚本xsync么？现在到它起作用的时候来了。看好了，别眨眼，记得直呼666。操作如下
```
[root@hadoop1 hadoop]# cd ..
[root@hadoop1 etc]# xsync hadoop/
```
怎么样，结果跟我这个一样不一样，你就看看另外两台虚拟机里面的这些对应的配置文件，是不是修改了，我就问你6不6，值不值得点个赞，加个关注？？

再修改/sbin目录下的几个配置文件

[root@hadoop1 etc]# cd ../sbin
[root@hadoop1 sbin]#

修改start-dfs.sh,以及stop-dfs.sh,在这两个文件的开头加上以下配置

HDFS_DATANODE_USER=root
HADOOP_SECURE_SECURE_USER=root
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

在这里插入图片描述
修改start-yarn.sh,以及stop-yarn.sh,在这两个文件的开头加上以下配置

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=root
YARN_NODEMANAGER_USER=root

在这里插入图片描述

#又分发下已配置的配置文件到hadoop2,hadoop3
[root@hadoop1 sbin]# cd ..
[root@hadoop1 hadoop]# xsync sbin/

启动Hadoop

初始化hadoop

[root@hadoop1 hadoop]# hadoop  namenode  -format

在这里插入图片描述

启动集群
```
[root@hadoop1 hadoop]# start-all.sh
```
然后再输入jps看看
```
[root@hadoop1 hadoop]# jps
```
只要运行结果如上，都说明成功了，那么现在去浏览器里面输入hadoop1这个主节点的ip地址访问试试，我的是http://192.168.75.146:9870/

这里表示存在三个节点，说明成功了，但是这里访问8088端口，却访问不了,这个时候就会有人认为又出问题了，其实没有。仔细回顾上面在一开始配置hadoop时，我弄了张表格，发现ResourceManager这个节点是配置hadoop2上面的。而这个东西，是要手动到hadoop2上面去运行的，才会出来。所以这个时候切换到hadoop2这台主机启动一下。

hadoop2启动ResourceManager

[root@hadoop2 hadoop]# start-yarn.sh

然后再使用jps查看一下

[root@hadoop2 hadoop]# jps

在这里插入图片描述

这不就成功了！！！然后再在浏览器里面输入hadoop2的主机地址，端口使用8088，看看效果吧,我的是http://192.168.75.142:8088/cluster

在这里插入图片描述

er
而且可以很清楚的在这里看到每台服务器的状态。

总结

可能也有其他教程，比我这个简单。但是我个人觉得，搭建一个hadoop就需要这样，使用三台服务器，一台当做NameNode，一台当做SecondaryNameNode，最后一台当做ResourceManager，这样三台服务器都担任着不同的角色，使得其他服务的负荷不重，能够尽量的保证整个hadoop的顺畅运行（个人观点，不喜勿喷）

最后修改：2022 年 03 月 05 日

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

评论 *

私密评论

名称 *

🎲

邮箱 *

地址

时光匆匆

今日已经过去小时

这周已经过去天

本月已经过去天

今年已经过去个月

Linux centos 配置hadoop集群

TheRivers • 2022 年 01 月 04 日

<div class="inner-content" >
<p class="inser-title">Hadoop，相关配置文件</p>
<div class="inster-summary text-muted">
Hadoop配置这篇博文，添加了一些Hadoop的配置文件，设置historyserver，以及日志查看。core...
</div>
</div>
</a>

</div>

</div></p><h2>LinuxCentos7配置hadoop</h2><p><strong>准备条件</strong></p><ol><li>apache-hadoop-3.3.0 jar包<br>  <span class="external-link"><a class="no-external-link" href="http://ljy0427.online/install/hadoop-3.3.0.tar.gz" target="_blank"><i data-feather="external-link"></i>hadoop-3.3.0(点击下载)</a></span></li><li>jdk1.8<br>  <span class="external-link"><a class="no-external-link" href="http://ljy0427.online/install/jdk1.8-linux.tar.gz" target="_blank"><i data-feather="external-link"></i>jdk1.8(点击下载)</a></span></li></ol><p><strong>最好还是自己去官网下载然后上传到虚拟机，如果用下面的方式可以会有网速限制，毕竟自己的小服务器，带宽有限，或者点击下方两个连接进行下载，下载之后，最后把这个的名字改成和我的对应起来，这样下面的配置就方便了。</strong><br><span class="external-link"><a class="no-external-link" href="https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-3.3.0/hadoop-3.3.0.tar.gz" target="_blank"><i data-feather="external-link"></i>Hadoop3.0清华源</a></span><br><span class="external-link"><a class="no-external-link" href="https://mirrors.tuna.tsinghua.edu.cn/AdoptOpenJDK/8/jdk/x64/linux/OpenJDK8U-jdk_x64_linux_openj9_linuxXL_8u282b08_openj9-0.24.0.tar.gz" target="_blank"><i data-feather="external-link"></i>jdk1.8清华源</a></span><br>另外，需要准备三台虚拟机，分别命名为hadoop1,hadoop2,hadoop3,并且将这三台虚拟机这样配置接点，原理就不多说了。</p><table><thead><tr><th align="center"> </th><th align="center">hadoop1</th><th align="center">hadoop2</th><th align="center">hadoop3</th></tr></thead><tbody><tr><td align="center">HDFS</td><td align="center">NameNode<br>DataNode</td><td align="center">DataNode</td><td align="center">SecondaryNameNode<br>DataNode</td></tr><tr><td align="center">YARN</td><td align="center">NodeManager</td><td align="center">ResourceManager<br>NodeManager</td><td align="center">NodeManager</td></tr></tbody></table><h2>开始配置</h2><ol><li>配置/etc/hostname，更改为hadoop1。目前这些步骤只用配置一台虚拟机，之后的通过虚拟机克隆得到haoop2,hadoop3。注意，在克隆之后，仍然要修改对应的主机名。</li></ol><pre><code>
```swift
[root@localhost ~]# yum install vim -y
#先下载vim，方便编辑查看区别
[root@localhost ~]# vim /etc/hostname
```
将这里的这行删掉，然后修改成hadoop1![在这里插入图片描述](https://img-blog.csdnimg.cn/20210326142312651.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70#pic_right)
</code></pre><ol start="3"><li><p>配置/etc/hosts</p></li></ol><pre><code>
```swift
[root@localhost ~]# vim /etc/hosts
```
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210326142737580.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70#pic_right)
修改成这样，先填入另两个虚拟机的地址，因为是使用克隆，所以三台虚拟机之间的ip地址相差不过，只用小作修改。修改好以后重启一下虚拟机就生效了。</code></pre><ol start="4"><li><p>配置jdk1.8</p><blockquote>可以通过上面给的连接下载然后通过工具传到linux上面，或者使用下面这个命令下载jdk，跟着顺序来，一步步的来，别慌。</blockquote><pre><code class="lang-swift">[root@hadoop1 ~]# yum install wget -y</code></pre><pre><code class="lang-swift">[root@hadoop1 ~]# mkdir /java
[root@hadoop1 ~]# cd /java
[root@hadoop1 java]# wget -i -c http://ljy0427.online/install/jdk1.8-linux.tar.gz
#下载完成之后，解压
[root@hadoop1 java]# tar -zxvf jdk1.8-linux.tar.gz
#解压成功之后，重命名文件夹
[root@hadoop1 java]# mv jdk1.8.0_144 java</code></pre><blockquote>配置环境变量,在/etc/profile.d/目录下，自己创建一个.sh文件</blockquote><pre><code class="lang-swift">[root@hadoop1 java]# vim /etc/profile.d/my_env.sh
#添加如下东西</code></pre><blockquote><code>export JAVA_HOME=/java/java</code><br><code>export PATH=$PATH:$JAVA_HOME/bin</code><br>添加了以后，保存退出</blockquote><pre><code class="lang-swift">#重新刷新配置文件
[root@hadoop1 java]# source /etc/profile
#测试配置成功，只要出现版本号就说明配置成功了
[root@hadoop1 java]# java -version</code></pre></li><li><p>配置hadoop</p><blockquote>下载并解压apache-hadoop3.3.0</blockquote><pre><code class="lang-swift">[root@hadoop1 java]# mkdir /opt/hadoop
[root@hadoop1 java]# cd /opt/hadoop</code></pre><blockquote>如果之前没有下载的话，就在这个/opt/hadoop使用下面这个命令下载吧。</blockquote><pre><code class="lang-swift">[root@hadoop1 hadoop]# wget -i -c http://ljy0427.online/install/hadoop-3.3.0.tar.gz</code></pre><blockquote>解压这个解压包</blockquote><pre><code class="lang-swift">[root@hadoop1 hadoop]# tar -zxvf hadoop-3.3.0.tar.gz
#重命名解压包
[root@hadoop1 hadoop]# mv hadoop-3.3.0 hadoop</code></pre><blockquote>配置hadoop环境变量</blockquote><pre><code class="lang-swift">[root@hadoop1 hadoop]# vim /etc/profile.d/my_env.sh</code></pre><blockquote>添加如下内容<br><code>export HADOOP_HOME=/opt/hadoop/hadoop</code><br><code>export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin</code><br><img src="https://img-blog.csdnimg.cn/20210326150825416.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70#pic_right" alt="在这里插入图片描述" title="在这里插入图片描述" style=""></blockquote><pre><code class="lang-swift">[root@hadoop1 hadoop]# source /etc/profile
#测试配置是否成功
[root@hadoop1 hadoop]# hadoop
#输入这个命令，看是否弹出一堆东西来</code></pre><p><img src="https://img-blog.csdnimg.cn/20210326151033442.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70#pic_right" alt="在这里插入图片描述" title="在这里插入图片描述" style=""></p><pre><code class="lang-swift">#之后先创建一些文件夹放着
[root@hadoop1 hadoop]# mkdir /opt/hadoop/hadoop_data
[root@hadoop1 hadoop]# mkdir /opt/hadoop/hadoop_data/tmp
[root@hadoop1 hadoop]# mkdir /opt/hadoop/hadoop_data/var
[root@hadoop1 hadoop]# mkdir /opt/hadoop/hadoop_data/dfs
[root@hadoop1 hadoop]# mkdir /opt/hadoop/hadoop_data/dfs/name
[root@hadoop1 hadoop]# mkdir /opt/hadoop/hadoop_data/dfs/data</code></pre></li><li>关闭防火墙，参考下面这篇博文 <br>   <span class="external-link"><a class="no-external-link" href="https://blog.csdn.net/SaberJYang/article/details/69665927" target="_blank"><i data-feather="external-link"></i>关闭防火墙</a></span></li><li>关闭了防火墙之后，就可以克隆虚拟机了</li><li><p>在克隆之前，再来一个操作，内行人看了都直呼666的操作，看好了</p><blockquote>创建一个脚本名字为,xsync,跟着我的顺序来，一步步的来，莫慌。</blockquote><pre><code class="lang-swift">[root@hadoop1 hadoop]# mkdir /root/bin
[root@hadoop1 hadoop]# cd /root/bin
[root@hadoop1 bin]# vim xsync</code></pre><blockquote>在里面添加如下脚本</blockquote><pre><code class="lang-bash">#!/bin/bash    
if [ $# -lt 1 ]
then 
    echo Not Enough Arguement!
    exit;
fi
#注意，如果你的主机名命名和我不一样，下面这三个更换成你的主机名
for host in hadoop1 hadoop2 hadoop3
do 
    echo =================  $host  =================      
    for file in $@
    do
        if [ -e $file ]
            then
                pdir=$(cd -P $(dirname $file); pwd)
                fname=$(basename $file)
                ssh $host &quot;mkdir -p $pdir&quot;
                rsync -av $pdir/$fname $host:$pdir
            else
                echo $file does not exists!                
        fi
    done
done    </code></pre><pre><code class="lang-swift">#创建完成之后，给这个脚本添加权限
[root@hadoop1 bin]# chmod +x xsync

#可以克隆了，克隆的时候，一定要将虚拟机关机才可以。
#克隆完成之后，每台虚拟机都需要下载下面这个工具
[root@hadoop1 bin]# yum install rsync -y
</code></pre></li><li>克隆完成之后，根据自己的虚拟机所分配的地址，修改三台虚拟机的/etc/hosts中的ip地址，以及/etc/hostname中的主机名</li></ol><h2>实现三台主机之间免密登录</h2><blockquote>参考我这篇博文<br><span class="external-link"><a class="no-external-link" href="https://blog.csdn.net/weixin_44851055/article/details/115204011" target="_blank"><i data-feather="external-link"></i>ssh免密登录</a></span></blockquote><pre><code>最好三台虚拟都使用ssh-copy-id hostname</code></pre><h2>修改hadoop的配置文件</h2><ol><li><p>为了保证没啥大问题，在hadoop的hadoop-env.sh中添加JAVA_HOME的路劲</p><pre><code class="lang-swift">[root@hadoop1 ~]# cd /opt/hadoop/hadoop/etc/hadoop/
[root@hadoop1 hadoop]# vim hadoop-env.sh</code></pre><blockquote>修改之前<img src="https://img-blog.csdnimg.cn/20210326154953502.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70#pic_right" alt="" title="" style=""><br>修改之后<br><img src="https://img-blog.csdnimg.cn/20210326155119661.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70#pic_right" alt="在这里插入图片描述" title="在这里插入图片描述" style=""></blockquote></li></ol><ol start="2"><li><p>修改hdfs-site.xml</p><pre><code class="lang-swift">[root@hadoop1 hadoop]# vim hdfs-site.xml
#如果你设置的主机名和我的不同，那记得将我这个配置文件里面的hadoop1替换成你对应的主机名。</code></pre><p><img src="https://img-blog.csdnimg.cn/2021032615545856.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70#pic_right" alt="在这里插入图片描述" title="在这里插入图片描述" style=""></p><p>在<code>&lt;configuration&gt;</code> 里面添加以下东西</p><pre><code class="lang-xml">    &lt;!-- 指定NameNode的web端访问地址 --&gt;
&lt;property&gt;
        &lt;name&gt;dfs.namenode.http-address&lt;/name&gt;
        &lt;value&gt;hadoop1:9870&lt;/value&gt;
&lt;/property&gt;
    
    &lt;!-- 设置SecondaryNameNode(2NN)的web端访问地址 --&gt;
&lt;property&gt;
        &lt;name&gt;dfs.namenode.secondary.http-address&lt;/name&gt;
        &lt;value&gt;hadoop3:9868&lt;/value&gt;
&lt;/property&gt;

&lt;property&gt;
   &lt;name&gt;dfs.name.dir&lt;/name&gt;
   &lt;value&gt;/opt/hadoop/hadoop_data/dfs/name&lt;/value&gt;
   &lt;description&gt;Path on the local filesystem where theNameNode stores the namespace and transactions logs persistently.&lt;/description&gt;
&lt;/property&gt;

&lt;property&gt;
   &lt;name&gt;dfs.data.dir&lt;/name&gt;
   &lt;value&gt;/opt/hadoop/hadoop_data/dfs/data&lt;/value&gt;
   &lt;description&gt;Comma separated list of paths on the localfilesystem of a DataNode where it should store its blocks.&lt;/description&gt;
&lt;/property&gt;

&lt;property&gt;
   &lt;name&gt;dfs.replication&lt;/name&gt;
   &lt;value&gt;3&lt;/value&gt;
&lt;/property&gt;

&lt;property&gt;
      &lt;name&gt;dfs.permissions&lt;/name&gt;
      &lt;value&gt;true&lt;/value&gt;
      &lt;description&gt;need not permissions&lt;/description&gt;
&lt;/property&gt;</code></pre></li><li><p>复制并且修改mapred-site.xml</p><pre><code class="lang-swift">[root@hadoop1 hadoop]# cp mapred-site.xml mapred-site.xml.template
[root@hadoop1 hadoop]# vim mapred-site.xml</code></pre><blockquote>也是一样的在<code>&lt;configuration&gt;</code> 里面添加以下东西</blockquote></li></ol><pre><code class="lang-xml">&lt;!-- 指定MapReduce程序运行在Yarn上的地址 --&gt;
&lt;property&gt;
        &lt;name&gt;mapreduce.framework.name&lt;/name&gt;
        &lt;value&gt;yarn&lt;/value&gt;
 &lt;/property&gt;
&lt;property&gt;
   &lt;name&gt;mapred.job.tracker&lt;/name&gt;
   &lt;value&gt;hadoop1:49001&lt;/value&gt;
&lt;/property&gt;

&lt;property&gt;
      &lt;name&gt;mapred.local.dir&lt;/name&gt;
       &lt;value&gt;/opt/hadoop/hadoop_data/var&lt;/value&gt;
&lt;/property&gt;

</code></pre><ol start="4"><li><p>配置yarn-site.xml，跟上面一样，在同样的位置添加以下东西</p><pre><code class="lang-swift">[root@hadoop1 hadoop]# vim yarn-site.xml</code></pre><pre><code class="lang-xml">&lt;!-- 指定MapReduce走shuffle --&gt;
&lt;property&gt;
    &lt;name&gt;yarn.nodemanager.aux-services&lt;/name&gt;
    &lt;value&gt;mapreduce_shuffle&lt;/value&gt;
&lt;/property&gt;
&lt;!-- 指定ResourceManager的地址 --&gt;
&lt;property&gt;
    &lt;name&gt;yarn.resourcemanager.hostname&lt;/name&gt;
    &lt;value&gt;hadoop2&lt;/value&gt;
&lt;/property&gt;

&lt;property&gt;
    &lt;description&gt;The address of the applications manager interface in the RM.&lt;/description&gt;
    &lt;name&gt;yarn.resourcemanager.address&lt;/name&gt;
    &lt;value&gt;${yarn.resourcemanager.hostname}:8032&lt;/value&gt;
&lt;/property&gt;

&lt;property&gt;
    &lt;description&gt;The address of the scheduler interface.&lt;/description&gt;
    &lt;name&gt;yarn.resourcemanager.scheduler.address&lt;/name&gt;
    &lt;value&gt;${yarn.resourcemanager.hostname}:8030&lt;/value&gt;
&lt;/property&gt;

&lt;property&gt;
    &lt;description&gt;The http address of the RM web application.&lt;/description&gt;
    &lt;name&gt;yarn.resourcemanager.webapp.address&lt;/name&gt;
    &lt;value&gt;${yarn.resourcemanager.hostname}:8088&lt;/value&gt;
&lt;/property&gt;

&lt;property&gt;
    &lt;description&gt;The https adddress of the RM web application.&lt;/description&gt;
    &lt;name&gt;yarn.resourcemanager.webapp.https.address&lt;/name&gt;
    &lt;value&gt;${yarn.resourcemanager.hostname}:8090&lt;/value&gt;
&lt;/property&gt;

&lt;property&gt;
    &lt;name&gt;yarn.resourcemanager.resource-tracker.address&lt;/name&gt;
    &lt;value&gt;${yarn.resourcemanager.hostname}:8031&lt;/value&gt;
&lt;/property&gt;

&lt;property&gt;
    &lt;description&gt;The address of the RM admin interface.&lt;/description&gt;
    &lt;name&gt;yarn.resourcemanager.admin.address&lt;/name&gt;
    &lt;value&gt;${yarn.resourcemanager.hostname}:8033&lt;/value&gt;
&lt;/property&gt;

&lt;property&gt;
    &lt;name&gt;yarn.scheduler.maximum-allocation-mb&lt;/name&gt;
    &lt;value&gt;2048&lt;/value&gt;
    &lt;discription&gt;每个节点可用内存,单位MB,默认8182MB&lt;/discription&gt;
&lt;/property&gt;

&lt;property&gt;
    &lt;name&gt;yarn.nodemanager.vmem-pmem-ratio&lt;/name&gt;
    &lt;value&gt;2.1&lt;/value&gt;
&lt;/property&gt;

&lt;property&gt;
    &lt;name&gt;yarn.nodemanager.resource.memory-mb&lt;/name&gt;
    &lt;value&gt;2048&lt;/value&gt;
&lt;/property&gt;

&lt;property&gt;
    &lt;name&gt;yarn.nodemanager.vmem-check-enabled&lt;/name&gt;
    &lt;value&gt;false&lt;/value&gt;
&lt;/property&gt;
</code></pre></li><li><p>配置core-site.xml,同上</p><pre><code class="lang-swift">[root@hadoop1 hadoop]# vim core-site.xml</code></pre><pre><code class="lang-xml">    &lt;property&gt;

&lt;name&gt;hadoop.tmp.dir&lt;/name&gt;

&lt;value&gt;/opt/hadoop/hadoop_data/tmp&lt;/value&gt;

&lt;description&gt;Abase for other temporary directories.&lt;/description&gt;

&lt;/property&gt;

&lt;property&gt;

&lt;name&gt;fs.default.name&lt;/name&gt;
        &lt;!-- hadoop1的内网IP地址 --&gt;
        &lt;value&gt;hdfs://hadoop1:9000&lt;/value&gt;

&lt;/property&gt;

&lt;!-- 指定NameNode的地址 --&gt;
    &lt;property&gt;
        &lt;name&gt;fs.defaultFS&lt;/name&gt;
        &lt;value&gt;hdfs://hadoop1:8020&lt;/value&gt;
    &lt;/property&gt;</code></pre></li><li><p>配置workers，将三个主机名添加进去。</p><pre><code class="lang-swift">[root@hadoop1 hadoop]# vim workers</code></pre><blockquote>记住必须严格按照我的效果图，主机名称后面不准有空格，只能换行！<br><img src="https://img-blog.csdnimg.cn/20210326161846315.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70#pic_right" alt="在这里插入图片描述" title="在这里插入图片描述" style=""></blockquote></li><li><p>同步这些配置文件到hadoop2,hadoop3上</p><blockquote>到了这里，有些人已经崩溃了，还要配两次？？？<br>要配置两遍，那是对于别人，看好我的操作，一次就好。<br>前面不是创建了一个脚本xsync么？现在到它起作用的时候来了。看好了，别眨眼，记得直呼666。操作如下</blockquote><pre><code class="lang-swift">[root@hadoop1 hadoop]# cd ..
[root@hadoop1 etc]# xsync hadoop/</code></pre><p><img src="https://img-blog.csdnimg.cn/20210326162517674.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70#pic_right" alt="在这里插入图片描述" title="在这里插入图片描述" style=""></p><blockquote>怎么样，结果跟我这个一样不一样，你就看看另外两台虚拟机里面的这些对应的配置文件，是不是修改了，我就问你6不6，值不值得点个赞，加个关注？？</blockquote></li><li><p>再修改/sbin目录下的几个配置文件</p><pre><code class="lang-swift">[root@hadoop1 etc]# cd ../sbin
[root@hadoop1 sbin]# </code></pre><p>修改start-dfs.sh,以及stop-dfs.sh,在这两个文件的开头加上以下配置</p><pre><code class="lang-php">HDFS_DATANODE_USER=root
HADOOP_SECURE_SECURE_USER=root
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root</code></pre><p><img src="https://img-blog.csdnimg.cn/20210326163212657.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70#pic_right" alt="在这里插入图片描述" title="在这里插入图片描述" style=""><br>修改start-yarn.sh,以及stop-yarn.sh,在这两个文件的开头加上以下配置</p><pre><code class="lang-php">YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=root
YARN_NODEMANAGER_USER=root</code></pre><p><img src="https://img-blog.csdnimg.cn/20210326163421658.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70#pic_right" alt="在这里插入图片描述" title="在这里插入图片描述" style=""></p><pre><code class="lang-swift">#又分发下已配置的配置文件到hadoop2,hadoop3
[root@hadoop1 sbin]# cd ..
[root@hadoop1 hadoop]# xsync sbin/</code></pre></li></ol><h2>启动Hadoop</h2><ol><li><p>初始化hadoop</p><pre><code class="lang-swift">[root@hadoop1 hadoop]# hadoop  namenode  -format</code></pre><p><img src="https://img-blog.csdnimg.cn/20210326163948129.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70#pic_right" alt="在这里插入图片描述" title="在这里插入图片描述" style=""></p></li><li><p>启动集群</p><pre><code class="lang-swift">[root@hadoop1 hadoop]# start-all.sh</code></pre><p><img src="https://img-blog.csdnimg.cn/20210326164356762.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70#pic_right" alt="在这里插入图片描述" title="在这里插入图片描述" style=""></p><blockquote>然后再输入jps看看</blockquote><pre><code class="lang-swift">[root@hadoop1 hadoop]# jps</code></pre><p><img src="https://img-blog.csdnimg.cn/20210326164606829.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70#pic_right" alt="在这里插入图片描述" title="在这里插入图片描述" style=""></p><blockquote>只要运行结果如上，都说明成功了，那么现在去浏览器里面输入hadoop1这个主节点的ip地址访问试试，我的是<span class="external-link"><a class="no-external-link" href="http://192.168.75.146:9870/" target="_blank"><i data-feather="external-link"></i>http://192.168.75.146:9870/</a></span><br><img src="https://img-blog.csdnimg.cn/2021032616544558.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70#pic_right" alt="在这里插入图片描述" title="在这里插入图片描述" style=""><br><img src="https://img-blog.csdnimg.cn/20210326165458764.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70#pic_right" alt="在这里插入图片描述" title="在这里插入图片描述" style=""><br>这里表示存在三个节点，说明成功了，但是这里访问8088端口，却访问不了,这个时候就会有人认为又出问题了，其实没有。仔细回顾上面在一开始配置hadoop时，我弄了张表格，发现ResourceManager这个节点是配置hadoop2上面的。而这个东西，是要手动到hadoop2上面去运行的，才会出来。所以这个时候切换到hadoop2这台主机启动一下。</blockquote></li><li><p>hadoop2启动ResourceManager</p><pre><code class="lang-swift">[root@hadoop2 hadoop]# start-yarn.sh</code></pre><p>然后再使用jps查看一下</p><pre><code class="lang-swift">[root@hadoop2 hadoop]# jps</code></pre><p><img src="https://img-blog.csdnimg.cn/20210326170053436.png#pic_right" alt="在这里插入图片描述" title="在这里插入图片描述" style=""></p></li></ol><blockquote>这不就成功了！！！然后再在浏览器里面输入hadoop2的主机地址，端口使用8088，看看效果吧,我的是<span class="external-link"><a class="no-external-link" href="http://192.168.75.142:8088/cluster" target="_blank"><i data-feather="external-link"></i>http://192.168.75.142:8088/cluster</a></span></blockquote><p><img src="https://img-blog.csdnimg.cn/20210326170308879.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70#pic_right" alt="在这里插入图片描述" title="在这里插入图片描述" style=""></p><blockquote>er<img src="https://img-blog.csdnimg.cn/20210326170534999.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70" alt="在这里插入图片描述" title="在这里插入图片描述" style=""><img src="https://img-blog.csdnimg.cn/2021032617053562.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg1MTA1NQ==,size_16,color_FFFFFF,t_70" alt="在这里插入图片描述" title="在这里插入图片描述" style=""><br>而且可以很清楚的在这里看到每台服务器的状态。</blockquote><h2>总结</h2><blockquote>可能也有其他教程，比我这个简单。但是我个人觉得，搭建一个hadoop就需要这样，使用三台服务器，一台当做NameNode，一台当做SecondaryNameNode，最后一台当做ResourceManager，这样三台服务器都担任着不同的角色，使得其他服务的负荷不重，能够尽量的保证整个hadoop的顺畅运行（<strong>个人观点，不喜勿喷</strong>）</blockquote>

Linux centos 配置hadoop集群

LinuxCentos7配置hadoop

开始配置

实现三台主机之间免密登录

修改hadoop的配置文件

启动Hadoop

总结

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

Vue计算属性computed

Linux centos7配置hive

Linux centos 配置hadoop集群

Object.defineProperty回顾

Your Name

自定义指令

此内容被密码保护

Linux Cetnos7安装Mysql

Linux Centos7 ssh免密登陆

v-for中的key

Linux centos 配置hadoop集群

LinuxCentos7配置hadoop

开始配置

实现三台主机之间免密登录

修改hadoop的配置文件

启动Hadoop

总结

发表评论 取消回复 使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

Linux centos 配置hadoop集群

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款