Mongodb replicaset — вечный STARTUP2?

Question

Vadim Rybalko @Pas

Mongodb replicaset — вечный STARTUP2?

Есть монга, нормально функционирующий replica set из трёх участников: primary, secondary, arbiter:

MongoDB shell version: 2.4.8
connecting to: test
set_v2:STARTUP2> rs.status( )
{
	"set" : "set_v2",
	"date" : ISODate("2014-02-06T08:20:54Z"),
	"myState" : 5,
	"syncingTo" : "deb-db:27017",
	"members" : [
		{
			"_id" : 1,
			"name" : "eng-db:27017",
			"health" : 1,
			"state" : 7,
			"stateStr" : "ARBITER",
			"uptime" : 169086,
			"lastHeartbeat" : ISODate("2014-02-06T08:20:53Z"),
			"lastHeartbeatRecv" : ISODate("2014-02-06T08:20:54Z"),
			"pingMs" : 50
		},
		{
			"_id" : 2,
			"name" : "jam-db:27017",
			"health" : 1,
			"state" : 2,
			"stateStr" : "SECONDARY",
			"uptime" : 169086,
			"optime" : Timestamp(1391674853, 18),
			"optimeDate" : ISODate("2014-02-06T08:20:53Z"),
			"lastHeartbeat" : ISODate("2014-02-06T08:20:53Z"),
			"lastHeartbeatRecv" : ISODate("2014-02-06T08:20:53Z"),
			"pingMs" : 50,
			"syncingTo" : "deb-db:27017"
		},
		{
			"_id" : 3,
			"name" : "deb-db:27017",
			"health" : 1,
			"state" : 1,
			"stateStr" : "PRIMARY",
			"uptime" : 169086,
			"optime" : Timestamp(1391674852, 50),
			"optimeDate" : ISODate("2014-02-06T08:20:52Z"),
			"lastHeartbeat" : ISODate("2014-02-06T08:20:52Z"),
			"lastHeartbeatRecv" : ISODate("2014-02-06T08:20:52Z"),
			"pingMs" : 50
		},
		{
			"_id" : 4,
			"name" : "bac-db:27017",
			"health" : 1,
			"state" : 5,
			"stateStr" : "STARTUP2",
			"uptime" : 169109,
			"optime" : Timestamp(1391505782, 63),
			"optimeDate" : ISODate("2014-02-04T09:23:02Z"),
			"errmsg" : "syncing to: deb-db:27017",
			"self" : true
		}
	],
	"ok" : 1
}

Базы достаточно большие. Возникла необходимость добавить ещё одного участника. Добавил стандартным путём, но через какое-то время реплика перестала забирать дамп с primary.

Фрагмент лога на новом участнике со статусом STARTUP2:

Thu Feb  6 11:42:25.931 [rsBackgroundSync] Socket recv() timeout  212.158.000.000:27017
Thu Feb  6 11:42:25.931 [rsBackgroundSync] SocketException: remote: 212.158.000.000:27017 error: 9001 socket exception [RECV_TIMEOUT] server [212.158.000.000:27017] 
Thu Feb  6 11:42:25.931 [rsBackgroundSync] DBClientCursor::init call() failed
Thu Feb  6 11:42:25.931 [rsBackgroundSync] replSet not trying to sync from secondary_host:27017, it is vetoed for 389 more seconds

Фрагмент лога на Primary:

Thu Feb  6 12:16:19.894 [conn6710131] query local.oplog.rs query: { ts: { $gte: Timestamp 1391505782000|63 } } cursorid:7488360248332995795 ntoreturn:0 ntoskip:0 nscanned:102 keyUpdates:0 numYields: 19063 locks(micros) r:7039453 nreturned:101 reslen:16421 39051ms

То есть похоже, что oplog очень большой и есть некий timeout для участника реплики и startup2 не влезает в этот timeout.

Как, собственно, победить и запустить новый secondary в этом случае?

Вопрос задан более трёх лет назад
3648 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Компьютерные сети

+3 ещё

Простой
Трансляция на видео хостинги через прокси?
- 1 подписчик
- вчера
- 80 просмотров
2

ответа
Компьютерные сети

+4 ещё

Средний
В mikrotik скрытый SSID не вещает на 802.11n?
- 1 подписчик
- 02 мая
- 114 просмотров
2

ответа
Django

+2 ещё

Простой
Как подключить Django к MongoDB?
- 2 подписчика
- 01 мая
- 158 просмотров
1

ответ
Системное администрирование

Простой
Этот график меня беспокоит, что это может быть?
- 1 подписчик
- 01 мая
- 146 просмотров
1

ответ
Компьютерные сети

+2 ещё

Средний
Как настроить правила маршрутизации трафика для двух IP адресов на Ubuntu server?
- 1 подписчик
- 28 апр.
- 107 просмотров
2

ответа
Windows

+1 ещё

Сложный
"Boot Device Not Found" on HP laptop, как исправить?
- 1 подписчик
- 27 апр.
- 117 просмотров
2

ответа
Android

+2 ещё

Простой
Есть ли какая нибудь платформа для управления андроид?
- 2 подписчика
- 27 апр.
- 107 просмотров
1

ответ
JavaScript

+3 ещё

Средний
Как сделать выборку mongo?
- 1 подписчик
- 26 апр.
- 47 просмотров
0

ответов
Системное администрирование

+1 ещё

Простой
Проброс GPU на большое количество виртуальных машин, как?
- 8 подписчиков
- 25 апр.
- 1167 просмотров
4

ответа
Сетевое администрирование

+1 ещё

Простой
Настроить wake on lan для AnyDesk?
- 7 подписчиков
- 24 апр.
- 9188 просмотров
7

ответов
Показать ещё Загружается…

Инженер по системному администрированию

Деловая среда от Сбербанка • Москва

До 209 000 ₽

Системный администратор

Глобал Смарт Системс • Санкт-Петербург

от 100 000 до 120 000 ₽

Системный администратор (инженер) 🚀

Хабр • Москва

от 140 000 ₽

Развернуть опенсорсный проект Vocode на публичном сервисе Vercel

04 мая 2024, в 18:49

3000 руб./за проект

Доработка приложения и скриптов на python

04 мая 2024, в 17:58

10000 руб./за проект

Разработать 3Д модель сверла в NX10

04 мая 2024, в 17:40

1000 руб./за проект

Answer 1 · 2014-02-06 12:52:30

* Вывести проблемную ноду из реплики
* Удалить всё то, что она успела вытащить с PRIMARY
* Вывести арбитра из реплики
* Добавить первую ноду на общих правах

как-то так

Mongodb replicaset — вечный STARTUP2?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт