MongoDB. Шардированный кластер и Replica Set.

В нашей конфигурации мы будем использовать следующую схему:

Более универсальной схемой будет считаться следующая, она предполагает отказоустойчивость:

Начнем с установки mongodb демонов на сервера, будем использовать для этого официальную документацию

https://docs.mongodb.com/manual/tutorial/install-mongodb-on-red-hat/

config первого CFG реплика сет сервера для mongo

systemLog:

destination: file

logAppend: true

path: /var/log/mongodb/mongod.log

storage:

dbPath: /var/lib/mongo

journal:

enabled: true

processManagement:

fork: true

pidFilePath: /var/run/mongodb/mongod.pid

timeZoneInfo: /usr/share/zoneinfo

net:

port: 27017

bindIp: mongos-cfg1

replication:

oplogSizeMB: 10240

replSetName: "replconfig01"

sharding:

clusterRole: configsvr

Для остальных двух cfg серверов все по аналогии, меняем только bindIP.

Также стоит обратить внимание, что все ноды были описаны предварительно в /etc/hosts и файл hosts разлит на все ноды.

192.168.1.2 mongos

192.168.1.3 mongos-cfg1

192.168.1.4 mongos-cfg2

192.168.1.5 mongos-cfg3

192.168.1.6 dbstore1

192.168.1.7 dbstore2

192.168.1.8 dbstore3

Подключаемся к нашему первому серверу mongos-cfg1 и делаем репликасет

1	mongo --host mongos-cfg1 --port 27017

выполняем:

rs.initiate(

{

_id: "replconfig01",

configsvr: true,

members: [

{ _id : 0, host : "mongos-cfg1:27017" },

{ _id : 1, host : "mongos-cfg2:27017" },

{ _id : 2, host : "mongos-cfg3:27017" }

]

}

)

В выводе «ок»: 1 — означает успешное выполнение нашей предыдущей команды.

Проверяем состояние всех трех серверов, должен быть 1 Primary и 2 Secondary, команды для проверки состояния:

1 2	rs.isMaster() rs.status()

Сконфигурируем наши сторейджи для монги, конфиг такой

systemLog:

destination: file

logAppend: true

path: /var/log/mongodb/mongod.log

storage:

dbPath: /opt/mongo

directoryPerDB: true

journal:

enabled: true

processManagement:

fork: true

pidFilePath: /var/run/mongodb/mongod.pid

timeZoneInfo: /usr/share/zoneinfo

net:

port: 27017

bindIp: dbstore1

sharding:

clusterRole: shardsvr

Для каталога хранения данных mongo указанной dbPath проверим/установим верного владельца:

1	chown -R mongod:mongod /opt/mongo/

Запускаем сервисы, проверяем, что порт 27017 слушают нужные нам демоны.

Последние и самое интересное, настройка mongos — роутера всех запросов в наш будущий кластер.

После того, как на будущий роутер установлен пакет mongod, создадим service файл для того, чтобы mongos запускался автоматически

!!! Непосредственно mongod сервис должен быть остановлен и исключен из автозапуска !!!

1	nano /etc/systemd/system/mongos.service

[Unit]

Description=High-performance, schema-free document-oriented database

After=network.target

Documentation=https://docs.mongodb.org/manual

[Service]

Type=forking

User=root

Group=root

ExecStart=/usr/bin/mongos -f /etc/mongos.conf

PIDFile=/var/run/mongos.pid

LimitFSIZE=infinity

LimitCPU=infinity

LimitAS=infinity

LimitNOFILE=64000

LimitNPROC=64000

LimitMEMLOCK=infinity

TasksMax=infinity

TasksAccounting=false

[Install]

WantedBy=multi-user.target

Выполним команду для обновление списка сервисов

1	systemctl daemon-reload

1	systemctl enable mongos

Наш конфигурационный файл для mongos /etc/mongos.conf будет следующим:

systemLog:

destination: file

logAppend: true

path: /var/log/mongodb/mongos.log

processManagement:

fork: true

pidFilePath: /var/run/mongos.pid

timeZoneInfo: /usr/share/zoneinfo

net:

port: 27017

bindIp: 0.0.0.0

maxIncomingConnections: 20000

sharding:

configDB: "replconfig01/mongos-cfg1:27017,mongos-cfg2:27017,mongos-cfg3:27017"

Запускаем mongos сервис

1	systemctl start mongos

Проверяем, что работает

1 2	# netstat -ntupl \| grep mongos tcp 0 0 0.0.0.0:27017 0.0.0.0:* LISTEN 3570/mongos

Также в логе /var/log/mongodb/mongos.log должны быть строки с успешным подключением к нашему config replicaset mongo

Successfully connected to mongos-cfg1:27017

Successfully connected to mongos-cfg2:27017

Successfully connected to mongos-cfg3:27017

Последний штрих, регистрация наших mongo shard серверов в mongos роутере

На сервере mongos, подключаемся к нашему кластеру:

1	mongo --host mongos --port 27017

и добавляем наши shard сервера

sh.addShard( "dbstore1:27017")

sh.addShard( "dbstore2:27017")

sh.addShard( "dbstore3:27017")

Перейдем к практике. Сгенерируем данные и сделаем им шардированние.

Сгенерировать данные можно следующем способом

Создаем базу данных в mongo (на сервере mongos) и заходим в нее, далее выполним несколько команд чтобы сгенерировать 1 000 000 документов.

var day = 1000 * 60 * 60 * 24;

var randomDate = function () {return new Date(Date.now() - (Math.floor(Math.random() * day)));}

var randomName = function() {return (Math.random()+1).toString(36).substring(2);}

for (var i = 1; i <= 1000000; ++i) {db.lemp.insert({name: randomName(), creationDate: randomDate(), uid: i});}

После того как данные сгенерированны, надо сделать индекс шардирорвания.

Например, коллекция lemp уже содержит сгенерированные данные по примеру чуть выше.

mongos> show dbs

admin 0.000GB

config 0.002GB

lemp 0.433GB

1	mongos> use lemp

Для начала включаем шардирование для определенной коллекции

1	mongos> sh.enableSharding("lemp")

Проверем, что шардинг включился, команда sh.status() должна отоброзить в переменных статуса коллекции «partitioned» : true

...

{ "_id" : "lemp", "primary" : "shard0001", "partitioned" : true, "version" : { "uuid" : UUID("e0cb2b29-8028-455a-979c-386821998b16"), "lastMod" : 1 } }

...

Визуальное представление наших документов в коллекции

mongos> show collections

lemp

stack

В lemp для lemp будем строить хешированный индекс по полю id, не сильно удачно были сгенерированы данные для примера, но постараемся не запутаться.

Создаем индекс

1	mongos> db.lemp.createIndex({_id:"hashed"},{background:true})

Выполняем шардирование

1	mongos> sh.shardCollection("lemp.lemp",{"_id":"hashed"})

После данной команды должен запуститься балансировщик и чанки (chunks — части данных распределяющиеся между шардами) будут перемещаться по шардам

На скрине ниже, видно наличие 11 чанков распределенных по 3 шардам, 5 6 и 5 соответственно шардам 0000, 0001 и 0002

В данном примере в lemp содержится 5 000 000 документов распределенных между 3 шардами

Также в качестве замечания не стоит забывать про тюнинг самой ОС на которой будет находиться кластер.

Для mongo рекомендуется выбирать XFS

Настройки sysctl следующие

net.core.somaxconn = 4096

net.ipv4.tcp_fin_timeout = 30

net.ipv4.tcp_keepalive_intvl = 30

net.ipv4.tcp_keepalive_time = 120

net.ipv4.tcp_max_syn_backlog = 4096

vm.swappiness = 1

Не забываем синхронизировать время — устанавливаем ntp

А также изменить /sys/kernel/mm/transparent_hugepage/enabled с always на never

transparent_hugepage=never

в centos7 сделал делаем через tuned

Устанавливаем tuned

1 2	yum install tuned nano /etc/tuned/no-thp/tuned.conf

[main]

include=virtual-guest

[vm]

transparent_hugepages=never

И активируем данные профайл

1	~# tuned-adm profile no-thp

Ссылки

https://docs.mongodb.com/manual/tutorial/transparent-huge-pages/#using-tuned-and-ktune

https://www.percona.com/blog/2016/08/12/tuning-linux-for-mongodb/

https://docs.mongodb.com/manual/reference/limits/#sharded-clusters

https://dbversity.com/mongodb-sharding-best-practices/

https://dzone.com/articles/reclaiming-disk-space-from-mongodb

http://farenda.com/mongodb/how-to-generate-random-test-data-in-mongodb/

https://www.howtoforge.com/tutorial/deploying-mongodb-sharded-cluster-on-centos-7/

https://docs.mongodb.com/manual/tutorial/install-mongodb-on-red-hat/

https://docs.mongodb.com/manual/core/sharding-shard-key/

авторизация для шардированного кластера:
https://docs.mongodb.com/manual/tutorial/enforce-keyfile-access-control-in-existing-sharded-cluster-no-downtime/

5 thoughts on “MongoDB. Шардированный кластер и Replica Set.”

Evgeny:

16 мая, 2020 в 20:15

Отличная статья, с примером на практике. Спасибо автор!

Ответить
mailon:

17 мая, 2020 в 01:25

Пожалуйста! Но не стройте кластер без шардированных шардов, некоторые библиотеки не понимают, что такое может быть.

Ответить
Муон:

11 октября, 2020 в 14:57

Добрый день ! Помогите пожалуйста! Я попытался сделать шардирования на MongoDB. Все шагов верно, только при тестировании была проблемой: база данных только видит на одном шарде, а на другом не видит. Подскажите пожалуйста, где это я не правильно сделать ?

Ответить
1. mailon:
  
  11 октября, 2020 в 22:30
  
  Там пример есть в конце статьи. Там показано на практике как шардировать данные и базы.
  
  Ответить
  1. Муон:
    
    12 октября, 2020 в 09:31
    
    Спасибо вам за информации! Система уже работала как у вас. Проблема заключается в том что у меня мало количество документов, поэтому данные не разпределены. Я уже добавил еще и получается на двух шадрах. Теперь у меня такой вопрос: Могу ли я шардировать одном шадре под контролем. Например: У меня база данных Test с 3 коллекциями: T1, T2 и T3, в том коллекция T1 только шардирована на шадре 1, а коллекция T2 на на шадре 2, и T3 будет распределить на обах шардах.
    Спасибо, с уважением.
    
    Ответить

blog.mailon.com.ua

Укусить себя за хвост: chmod -x chmod

MongoDB. Шардированный кластер и Replica Set.

5 thoughts on “MongoDB. Шардированный кластер и Replica Set.”

Добавить комментарий Отменить ответ