在 IBM CAMP 服务器上实现开源 Hadoop HDFS 的高可用性-2

论坛元老

Rank: 8 Rank: 8

UID: 1066743

1^#

打印

字体大小: tT

look_w发表于 2017-12-19 20:55 | 只看该作者

在 IBM CAMP 服务器上实现开源 Hadoop HDFS 的高可用性-2

HDFS HA 的配置步骤：本文详解
架构图如下：
图 4.HDFS 利用 QJM 实现 HA 的架构图

Hadoop2.2.0 的源码编译
因为使用 IBM 的 JDK，目前需要在 Apache 官方网站上下载的源码包，然后打上补丁进行手动编译。具体编译步骤请参考，这里不在详细描述。编译成功后，会自动生成 ./hadoop-dist/target/hadoop-2.2.0.tar.gz 文件。
安装配置 Hadoop2.2.0 之前，进行环境设置
在 PLinux 系统上创建一个普通用户，本文创建一个用户名"hadoop"的用户。

1 2	[root@plinux09 ~]# id hadoop uid=500(hadoop) gid=501(hadoop) groups=501(hadoop)

创建目录/bigdata 与/hadoopdata，并且使用 chown -R 命令把这两个目录属性设置成 hadoop 用户和组。其中/bigdata 目录下存放所有的开源组件，/hadoopdata 用于存放 hdfs 的 NameNode 与 DataNode 数据。

1
2
3
4
5

[root@plinux09 ~]# chown -R hadoop:hadoop /bigdata /hadoopdata/
[root@plinux09 ~]# ll /
total 110
drwxr-xr-x. 9 hadoop hadoop 4096 Jan 9 22:17 bigdata
drwxr-xr-x. 5 hadoop hadoop 4096 Jan 9 23:05 hadoopdata

关闭所有分区上的 SELinux 与 Iptables，关闭 Selinux 后需要重启系统才能生效。

1
2
3
4

[root@rhel226 ~]# vim /etc/selinux/config
SELINUX=disabled
[root@rhel226 ~]# service iptables stop
[root@rhel226 ~]# chkconfig --level 345 iptables off

SSH 无密码验证配置
配置/etc/hosts 文件

1
2
3
4
5

[root@plinux09 ~]# cat /etc/hosts
10.10.10.24 plinux09
10.10.10.25 plinux10
10.10.10.27 plinux11
10.10.10.28 plinux12

在四个 plinux 系统上分别使用命令 ssh-keygen 生成的密钥对 id_rsa 和 id_rsa.pub，默认存放在"/home/hadoop/.ssh"目录下。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

[hadoop@plinux09 ~]$ ssh-keygen -t rsa -P ''
Generating public/private rsa key pair.
Enter file in which to save the key (/home/test/.ssh/id_rsa):
Created directory '/home/test/.ssh'.
Your identification has been saved in /home/test/.ssh/id_rsa.
Your public key has been saved in /home/test/.ssh/id_rsa.pub.
The key fingerprint is:
89:23:48:5b:f9:e5:6b:9b:32:b5:66:81:24:b4:e6:3b test@plinux09
The key's randomart image is:
+--[ RSA 2048]----+
|                |
| ..          |
|  ..o.  .       |
| . ++..+ .    |
|  oo.o+.S       |
| ....o.    |
|    . .oo    |
| E o.+o    |
|    . =o       |
+-----------------+

[hadoop@plinux09 .ssh]$ ls -al /home/hadoop/.ssh
-rw------- 1 hadoop hadoop 1675 Dec 23 13:36 id_rsa
-rw-r--r-- 1 hadoop hadoop  395 Dec 23 13:36 id_rsa.pub

然后把所有的公钥的内容添加 authorized_keys 文件里，再把这个文件分别拷贝到每台机器的相同目录下。

1	[hadoop@plinux09 ~]$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

设置 authorized_keys 文件属性为 600，否则 ssh 无密码验证不能生效。

1
2
3
4
5

[hadoop@plinux09 ~]$ chmod 600 ~/.ssh/authorized_keys
[hadoop@plinux09 ~]$ ll .ssh/
-rw-------. 1 hadoop hadoop 1193 Jan  9 21:06 authorized_keys
-rw-------. 1 hadoop hadoop 1675 Jan  9 21:00 id_rsa
-rw-r--r--. 1 hadoop hadoop  397 Jan  9 21:00 id_rsa.pub

配置/etc/security/limits.conf 文件，添加以下内容：

1
2
3
4
5
6
7
8
9

[hadoop@plinux09 ~]$ vim /etc/security/limits.conf
hadoop          soft nproc          -1
hadoop          hard nproc          -1
hadoop          soft nofile       -1
hadoop          hard nofile       65536
hadoop          soft memlock       -1
hadoop          hard memlock       -1
hadoop          soft sigpending    -1
hadoop          hard sigpending    -1

安装配置 Hadoop2.2.0,实现手动方式 NameNode HA 的切换
首先对编译生成的 hadoop-2.2.0.tar.gz 文件进行解压。

1	[hadoop@plinux09 bigdata]$ tar -zxvf hadoop-2.2.0.tar.gz

然后设置系统环境变量，修改~/.bash_profile 文件，添加以下内容：

1
2
3
4
5
6
7
8
9
10
11

export JAVA_HOME=/bigdata/ibm-java-ppc64-70
export CLASSPATH=.

CLASSPATH

JAVA_HOME/lib

JAVA_HOME/jre/lib
export HADOOP_HOME=/bigdata/hadoop
export ZOOKEEPER=/bigdata/zookeeper
export ZOO_LOG_DIR=/bigdata/zookeeper/data/logs
export HBASE_HOME=/bigdata/hbase
export HIVE_HOME=/bigdata/hive
export
PATH=$ZOOKEEPER/bin

PROTOBUF/bin

HBASE_HOME/bin

JAVA_HOME/bin

JAVA_HOME/jre/bin

HADOOP_HOME:\
$HADOOP_HOME/bin

HADOOP_HOME/sbin

HIVE_HOME:$HIVE_HOME/bin:$PATH
export HADOOP_HOME_WARN_SUPPRESS=1

运行以下命令使之生效:

1	[hadoop@plinux09 bigdata]$ . ~/.bash_profile

配置 hdfs-site.xml 文件，以便实现手动方式的 NameNode HA 切换

1	[hadoop@plinux09 bigdata]$ vim /bigdata/hadoop/etc/hadoop/hdfs-site.xml

1
2
3
4

<property>
<name>dfs.nameservices</name>
<value>mycluster</value>
</property>

1
2
3
4

<property>
<name>dfs.ha.namenodes.mycluster</name>
<value>nn1,nn2</value>
</property>

1
2
3
4
5
6
7
8

<property>
      <name>dfs.namenode.rpc-address.mycluster.nn1</name>
      <value>plinux09:8020</value>
</property>
<property>
      <name>dfs.namenode.rpc-address.mycluster.nn2</name>
      <value>plinux10:8020</value>
</property>

1
2
3
4
5
6
7
8

<property>
      <name>dfs.namenode.http-address.mycluster.nn1</name>
      <value>plinux09:50070</value>
</property>
<property>
      <name>dfs.namenode.http-address.mycluster.nn2</name>
      <value>plinux10:50070</value>
</property>

1
2
3
4

<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://plinux09:8485;plinux10:8485;plinux11:8485/mycluster</value>
</property>

1
2
3
4
5

<property>
<name>dfs.client.failover.proxy.provider.mycluster</name>
   <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider
   </value>
</property>

1
2
3
4
5
6
7
8
9

<property>
                  <name>dfs.ha.fencing.methods</name>
                  <value>sshfence(hdfs)
                  shell(/bin/true)</value>
         </property>
         <property>
                  <name>dfs.ha.fencing.ssh.private-key-files</name>
                  <value>/home/hadoop/.ssh/id_rsa</value>
         </property>

1
2
3
4

<property>
<name>dfs.journalnode.edits.dir</name>
<value>/bigdata/hadoop/journalnode</value>
</property>

*注意： sshfence(hdfs)后是"回车"，这是源代码里定义成这种格式，否则使用其它符号 HA 将不能正常切换。

收藏分享评分

回复引用

订阅 TOP

返回列表