Hadoop HDFS в ражеми HA на Centos 7

В данной статье мы разберем как поднять Hadoop кластер c HDFS в режиме HA.

Будем использовать:

CentOS 7
2 сервера будут NameNode’ами в режиме Active и Standby
3 сервера для DataNode с фактором репликации = 3

Основная идея HDFS использовать его без точек монтирования на конечных клиентах.

Режим High Availability появился в Hadoop с версии 2.x для решения проблемы с единой точкой входа в отличие от версии Hadoop 1.х. Это было узкое место. Сейчас реализована концепция Master/Slave для NameNode, которые в свою очередь следят за DataNode.

Архитектура HDFS HA

Отказоустойчивость.

Apache Zookeeper — служба, обеспечивающая регистрацию всех событий и отвечающая за реализацию функционала отказоустойчивости в кластере.

ZookeerFailoverController (ZKFC) является клиентом Zookeeper, который контролирует и управляет статусом NameNode. Каждая из NameNode содержит ZKFC. ZKFC отвечает за мониторинг состояния NameNodes — активный (Active) и пассивный режимы (Standby/Passive).

Службы на активной NameNode:

Zookeeper
Zookeeper Fail Over controller
JournalNode
NameNode

Службы на пассивной NameNode:

Zookeeper
Zookeeper Fail Over controller
JournalNode
NameNode

Службы на DataNode:

Zookeeper
JournalNode
DataNode

Сервер	IP	Hostname
Active NameNode	192.168.0.99	nn1.cluster.com или nn1
Standby NameNode	192.168.0.100	nn2.cluster.com или nn2
DataNode 1	192.168.0.101	dn1.cluster.com или dn1
DataNode 2	192.168.0.102	dn2.cluster.com или dn2
DataNode 3	192.168.0.103	dn3.cluster.com или dn3

Обновляем систему, устанавливаем Java на все ноды:

1 2	yum update -y yum install -y nano wget mc java-1.7.0-openjdk java-1.7.0-openjdk-devel

Отключаем IPv6

1	nano /etc/sysctl.conf

1 2	net.ipv6.conf.all.disable_ipv6 = 1 net.ipv6.conf.default.disable_ipv6 = 1

sysctl -p

Приводим /etc/hosts к единому виду на всех нодах

192.168.0.99 nn1.cluster.com nn1

192.168.0.100 nn2.cluster.com nn2

192.168.0.101 dn1.cluster.com dn1

192.168.0.102 dn2.cluster.com dn2

192.168.0.103 dn3.cluster.com dn3

На каждой ноде генерируем ключи и копируем на каждую ноду

1	ssh-keygen -t rsa

1	cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

1	ssh-copy-id -i ~/.ssh/id_rsa.pub root@nn2.cluster.com

Перезагружаем sshd сервис

1	service sshd restart

Создаем структуру каталогов:

mkdir /home/data

mkdir /home/data/zookeeper

mkdir /home/data/nn1

chown -R 777 /home/data

Качаем стабильную версию, распаковываем и создаем симлинк для более простого поиска домашнего каталога Hadoop

cd /opt/

wget https://archive.apache.org/dist/hadoop/core/hadoop-2.9.1/hadoop-2.9.1.tar.gz

wget https://archive.apache.org/dist/zookeeper/zookeeper-3.4.13/zookeeper-3.4.13.tar.gz

tar -xvf hadoop-2.9.1.tar.gz

tar -xvf zookeeper-3.4.13.tar.gz

ln -s /opt/hadoop-2.9.1 /opt/hadoop

ln -s /opt/zookeeper-3.4.13 /opt/zookeeper

Редактируем .bashrc и добавляем переменные окружения для Java, Hadoop и Zookeeper.

export HADOOP_HOME=/opt/hadoop

export HADOOP_MAPRED_HOME=$HADOOP_HOME

export HADOOP_COMMON_HOME=$HADOOP_HOME

export HADOOP_HDFS_HOME=$HADOOP_HOME

export YARN_HOME=$HADOOP_HOME

export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop

export JAVA_HOME=/usr/lib/jvm/jre-1.7.0-openjdk-1.7.0.191-2.6.15.4.el7_5.x86_64

export ZOOKEEPER_HOME=/opt/zookeeper

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$ZOOKEEPER_HOME/bin

Также, рекомендуется добавить эти же переменные окружения в файл

1	/opt/hadoop/etc/hadoop/hadoop-env.sh

На NameNode1 (nn1) редактируем файл core-site.xml

1	nano /opt/hadoop/etc/hadoop/core-site.xml

Добавляем:

<name>fs.defaultFS</name>

<value>hdfs://ha-cluster</value>

</property>

<name>dfs.journalnode.edits.dir</name>

</property>

<name>fs.trash.interval</name>

</property>

<name>ipc.maximum.data.length</name>

</property>

</configuration>

Редактируем основной файл конфигурации hdfs-site.xml

1	nano /opt/hadoop/etc/hadoop/hdfs-site.xml

Добавляем:

<name>dfs.namenode.name.dir</name>

</property>

<name>dfs.replication</name>

</property>

<name>dfs.permissions</name>

<value>false</value>

</property>

<name>dfs.nameservices</name>

<value>ha-cluster</value>

</property>

<name>dfs.ha.namenodes.ha-cluster</name>

</property>

<name>dfs.namenode.rpc-address.ha-cluster.nn1</name>

</property>

<name>dfs.namenode.rpc-address.ha-cluster.nn2</name>

</property>

<name>dfs.namenode.http-address.ha-cluster.nn1</name>

<value>nn1.cluster.com:50070</value>

</property>

<name>dfs.namenode.http-address.ha-cluster.nn2</name>

<value>nn2.cluster.com:50070</value>

</property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://nn1.cluster.com:8485;nn2.cluster.com:8485;dn1.cluster.com:8485;dn2.cluster.com:8485;dn3.cluster.com:8485/ha-cluster</value>

</property>

<name>dfs.client.failover.proxy.provider.ha-cluster</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<name>dfs.ha.automatic-failover.enabled</name>

</property>

<name>ha.zookeeper.quorum</name>

<value>nn1.cluster.com:2181,nn2.cluster.com:2181,dn1.cluster.com:2181,dn2.cluster.com:2181,dn3.cluster.com:2181</value>

</property>

<name>dfs.ha.fencing.methods</name>

<value>sshfence</value>

</property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

</property>

<name>dfs.namenode.heartbeat.recheck-interval</name>

</property>

</configuration>

Обратим на важные параметры:

dfs.replication — фактор репликации данных, указываем 3, он не должен быть больше чем кол-во datanode.

Так выглядит информация о файле при репликации 3

ha.zookeeper.quorum — наш zookeeper кворум, где искать ноды zk кластера, крайне необходимо для выбора лидера и всего обнаружение и регистрации состояния нод в кластере.

dfs.namenode.heartbeat.recheck-interval — интервал проверок datanode и помечать их как недоступные.

Приступаем к настройке Zookeeper

Создадим файл конфигурации

1	cp /opt/zookeeper/conf/zoo_sample.cfg /opt/zookeeper/conf/zoo.cfg

В основной файл настроек Zookeeper добавим все ноды нашего zk кластера

1	nano /opt/zookeeper/conf/zoo.cfg

tickTime=2000

initLimit=10

syncLimit=5

clientPort=2181

dataDir=/home/data/zookeeper

server.1=192.168.0.99:2888:3888

server.2=192.168.0.100:2888:3888

server.3=192.168.0.101:2888:3888

server.4=192.168.0.102:2888:3888

server.5=192.168.0.103:2888:3888

dataDir=/home/data/zookeeper — указываем каталог для хранения данных zookeeper

server.N — перечисляем все наши сервера, находящиеся в кворуме zookeeper

Копируем наши каталоги с настроенным Hadoop (/opt/hadoop-2.9.1) и Zookeeper (/opt/zookeeper-3.4.13) на все ноды, помещаем в аналогичный каталог /opt , создаем аналогичные симлинки и прописываем .bashrc переменные окружения, также не забываем создать каталоги для хранения данных (/home/data, /home/data/zookeeper, /home/data/nn1).

Настройка DataNode серверов

Отличие состоим в том, что нам необходимо создать иопределить дополнительный каталог для хранения данных HDFS.

1 2	mkdir /home/data/datanode/ chmod 755 /home/data/datanode/

На datanode серверах редактируем файл hdfs-site.xml и добавляем в него путь к данным:

1	nano /opt/hadoop/etc/hadoop/hdfs-site.xml

<name>dfs.datanode.data.dir</name>

<value>/home/data/datanode</value>

</property>

Вернемся к настройке zookeeper, после того как мы скопировали весь каталог на все ноды, с одинаковыми конфигами, теперь нам необходимо создать уникальный файл на каждом сервере — myid. ID должен соответствовать номеру N указанному в файле zoo.cfg

пример для сервера datanode1, он имеет server N=3 в файле zoo.cfg

1 2	cat /opt/zookeeper/conf/zoo.cfg \| grep 192.168.0.101 server.3=192.168.0.101:2888:3888

1 2	nano /home/data/zookeeper/myid 3

И так последовательно для каждого сервера в нашем zookeeper кворуме.

Создаем systemd скрипты для автоматического запуска сервисов после перезагрузки нод.

Список service конфигов для NameNode серверов (всего 4 шт):

1	nano /etc/systemd/system/journalnode.service

[Unit]

Description=Hadoop JournalNode service

After=network.target

After=systemd-user-sessions.service

After=network-online.target

[Service]

User=root

Type=forking

ExecStart=/opt/hadoop-2.9.1/sbin/hadoop-daemon.sh start journalnode

ExecStop=/opt/hadoop-2.9.1/sbin/hadoop-daemon.sh stop journalnode

TimeoutSec=30

Restart=on-failure

RestartSec=30

StartLimitInterval=350

StartLimitBurst=10

[Install]

WantedBy=multi-user.target

1	nano /etc/systemd/system/namenode.service

[Unit]

Description=Hadoop JournalNode service

After=network.target

After=systemd-user-sessions.service

After=network-online.target

[Service]

User=root

Type=forking

ExecStart=/opt/hadoop-2.9.1/sbin/hadoop-daemon.sh start namenode

ExecStop=/opt/hadoop-2.9.1/sbin/hadoop-daemon.sh stop namenode

TimeoutSec=30

Restart=on-failure

RestartSec=30

StartLimitInterval=350

StartLimitBurst=10

[Install]

WantedBy=multi-user.target

1	nano /etc/systemd/system/zkserver.service

[Unit]

Description=Hadoop JournalNode service

After=network.target

After=systemd-user-sessions.service

After=network-online.target

[Service]

User=root

Type=forking

ExecStart=/opt/zookeeper-3.4.13/bin/zkServer.sh start

ExecStop=/opt/zookeeper-3.4.13/bin/zkServer.sh stop

TimeoutSec=30

Restart=on-failure

RestartSec=30

StartLimitInterval=350

StartLimitBurst=10

[Install]

WantedBy=multi-user.target

1	nano /etc/systemd/system/zkfc.service

[Unit]

Description=Hadoop JournalNode service

After=network.target

After=systemd-user-sessions.service

After=network-online.target

[Service]

User=root

Type=forking

ExecStart=/opt/hadoop-2.9.1/sbin/hadoop-daemon.sh start zkfc

ExecStop=/opt/hadoop-2.9.1/sbin/hadoop-daemon.sh stop zkfc

TimeoutSec=30

Restart=on-failure

RestartSec=30

StartLimitInterval=350

StartLimitBurst=10

[Install]

WantedBy=multi-user.target

Для DataNode серверов список будет несколько иной, суммарно 3 сервиса:

Мы оставляем конфиги для:

journalnode.service
zkserver.service

Но дополнительно добавляем datanode.service

1	nano /etc/systemd/system/datanode.service

[Unit]

Description=Hadoop JournalNode service

After=network.target

After=systemd-user-sessions.service

After=network-online.target

[Service]

User=root

Type=forking

ExecStart=/opt/hadoop-2.9.1/sbin/hadoop-daemon.sh start datanode

ExecStop=/opt/hadoop-2.9.1/sbin/hadoop-daemon.sh stop datanode

TimeoutSec=30

Restart=on-failure

RestartSec=30

StartLimitInterval=350

StartLimitBurst=10

[Install]

WantedBy=multi-user.target

После добавления новых сервисов не забываем выполнить команду

1	systemctl daemon-reload

Приступаем к запуску нашего кластера.

Последовательность запуска крайне важна!

Условно, на нашей будующей активной namenode (сервер nn1), запускаем journalnode сервис

1	service journalnode start

Смотрим вывод команды jps, должена появиться journalnode демон с PID

# jps

4914 Jps

1465 JournalNode

Форматируем данную ноду nn1

1	nn1# hdfs namenode -format

Запускаем демон namenode

1	nn1# service namenode start && systemctl enable namenode

Переходим на nn2 (Standby сервер) и копируем метаданные с активной ноды (если спрашивает перезаписать существующие метаданные — отказываемся).

1	nn2# hdfs namenode -bootstrapStandby

Если команда выполнилась без ошибок, запускаем на nn2 демон namenode

1	nn2# service namenode start && systemctl enable namenode

Теперь запускаем Zookeeper на всех нодах нашего кластера, начинаем с Active Namenode (nn1), затем Standby Namenode (nn2), потом Datanode серверах (dn1, dn2, dn3):

1	all-servers# service zkserver start && systemctl enable zkserver

После запуска на всех нодах Zookeeper проверяем командой jps наличие сервиса QuorumPeerMain:

[root@nn1 ~]# jps

1465 JournalNode

1417 QuorumPeerMain

2104 Jps

3263 NameNode

Запускаем Datanode демона на Data node серверах:

1	dn# service datanode start && systemctl enable datanode

На Namenode серверах форматируем и запускаем Zookeeper fail сервис:

1	nn1# hdfs zkfc -formatZK

1	nn1# service zkfs start && systemctl enable zkfc

Вводим команду jps и смотрим наличие демона DFSZkFailoverController

[root@nn1 ~]# jps

1465 JournalNode

1417 QuorumPeerMain

2104 Jps

1467 DFSZKFailoverController

3263 NameNode

Выполняем на nn2 Standby сервере:

1	nn2# hdfs zkfc -formatZK

и запускаем демон

1	nn2# service zkfs start && systemctl enable zkfc

Проверяем jps, чтобы на nn2 запустился также DFSZkFailoverController.

Теперь проверим статус наших namenode серверов:

[root@nn1 ~]# hdfs haadmin -getServiceState nn1

active

[root@nn1 ~]# hdfs haadmin -getServiceState nn2

standby

Проверим в браузере как выглядим UI нашего кластера

1	<IP Namenode>:50070

Небольшой стресс тест, чтобы проверить переключаются или нет active и standby hdfs ноды местами

На nn1 сервера находим ID процесса namenode

[root@nn1 ~]# jps

1465 JournalNode

1417 QuorumPeerMain

2104 Jps

1467 DFSZKFailoverController

3263 NameNode

и убиваем его

1	kill -9 3263

Дополнительно.

hdfs позволяет активировать опцию — крзина, файлы после удаления некоторое время остаються на файловой системе и затем удаляються, для этого мы добавляли в файл core-site.xml опцию fs.trash.interval, ее значение задается в минутах.

После удаления файлы будут помещаться примерно по такому пути:

1	hdfs fs -ls /user/hadoop/.Trash

По-умолчанию web UI доступен без пароля, включим web авторизацию на dashboard hdfs.

nn1# cd /opt/hadoop

find ./ -type f -name "web.xml"

nano ./share/hadoop/hdfs/webapps/hdfs/WEB-INF/web.xml

Добавляем

<web-app version="2.4" xmlns="http://java.sun.com/xml/ns/j2ee">

<security-constraint>

<web-resource-collection>

<web-resource-name>Protected</web-resource-name>

<url-pattern>/*</url-pattern>

</web-resource-collection>

<auth-constraint>

<role-name>admin</role-name>

</auth-constraint>

</security-constraint>

<login-config>

<auth-method>BASIC</auth-method>

<realm-name>jobtrackerRealm</realm-name>

</login-config>

</web-app>

Создаем в том же каталоге файл с содержимым:

1	nano./share/hadoop/hdfs/webapps/hdfs/WEB-INF/jetty-web.xml

<Set name="name">jobtrackerRealm</Set>

<SystemProperty name="hadoop.home.dir"/>/etc/realm.properties

</Set>

</New>

</Set>

</Get>

</Configure>

Обращаем внимание на значение переменной в данной строке

1	<SystemProperty name="hadoop.home.dir"/>/jetty/etc/realm.properties

Тут мы указываем файл, в котором будет находиться реальное имя пользователя и пароль.

Создаем данный файл

1	$HADOOP_HOME/jetty/etc/realm.properties

Формат файла:

1	username: password,group.

У меня он находиться по данному пути и его содержимое следующее:

1	nn1# nano /opt/hadoop/etc/realm.properties

1	admin: superpassword,admin

После, перезагружаем демона namenode

1	nn1# service namenode stop && service namenode start

Полезные команды:

проверка статуса zk кластера

nn1# zkServer.sh status

ZooKeeper JMX enabled by default

Using config: /opt/zookeeper/bin/../conf/zoo.cfg

Mode: follower

У нас должен быть на одном из серверов обязательно Mode: active, на всех остальных follower

Ссылки:

За основу взята данная статья:

https://www.edureka.co/blog/how-to-set-up-hadoop-cluster-with-hdfs-high-availability/

Про корзину можно почитать тут:

Configuring Trash in HDFS

WEB авториазция отсюда: https://streever.atlassian.net/wiki/spaces/HADOOP/blog/2014/03/07/491558/Securing+Hadoop+HDP+Web+UI+Component+s

blog.mailon.com.ua

Укусить себя за хвост: chmod -x chmod

Hadoop HDFS в ражеми HA на Centos 7

Добавить комментарий Отменить ответ