Как сделать кластер виртуалок QEMU/KVM безопасным для виртуалок?

Question

homecreate @homecreate

Как сделать кластер виртуалок QEMU/KVM безопасным для виртуалок?

Всем привет

Допустим, имеется кластер, на котором предполагается запускать виртуальные вашины с использованием qemu-kvm. Естественно, требуется некое общее хранилище, где будут лежать образы. В случае, если хост завис (или подох), это будет обнаружено кластерным ПО и все виртуалки с этого хоста будут перезапущены. А вопрос в следующем: ведь если хост издох, то и данные в образы корректно дописаться не успели, так? И при перезапуске виртуалки мы получим ФС со сбоем, так? Даже более того, если корректно реализован STONITH, то в случае, допустим, отказа только сетевого интерфейса (уборщица отключила кабель) и при сохранении работоспособности линка в SAN, нода будет грубо застрелена в голову.

Как избежать такой ситуации?

Заранее спасибо

Вопрос задан более трёх лет назад
4691 просмотр

Комментировать

Подписаться 5 Оценить Комментировать

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

3 комментария

dyasny @dyasny

при чем тут облако? какой идиот в облаке вообще будет городить кластеры?

Написано более трёх лет назад
Пума Тайланд @opium

dyasny: личный кластер по сути и есть облако только приватное.

Написано более трёх лет назад
dyasny @dyasny

ну вот вообще ни разу не так. HA кластер существует для защиты определенного сервиса, a облако существует как способ выдать по требованию, ресурсы для обработки данных, причем "облачная" нагрузка по определению не бывает критичной, потому что отказоустойчивость обеспечивается массивностью установки (запустили 1000 серверов, если 200 упдаут - не страшно), а не мониторингом и алгоритмами SBA. в облаке SBA вообще не релевантно.

короче погуглите что такое pets and cattle в контексте облаков, все это давно разжевано.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Linux

+4 ещё

Простой
Как исправить ошибку при установке pam_sqlite?
- 1 подписчик
- 7 часов назад
- 18 просмотров
1

ответ
Linux

+1 ещё

Простой
Хочу заняться графической оболочкой для линукс. Есть ли какая-нибудь база дистрибутива?
- 1 подписчик
- 12 часов назад
- 100 просмотров
3

ответа
Linux

Средний
Linux на SSD рядом с Win10, на внешний HDD или виртуализация?
- 1 подписчик
- 22 часа назад
- 143 просмотра
6

ответов
Виртуализация

Простой
Как запускать ОС с обнуляющимся состоянием?
- 1 подписчик
- вчера
- 79 просмотров
3

ответа
Linux

+1 ещё

Простой
Что делать, если пишет «error: unknown filesystem Enering rescue mode... grub rescue>»?
- 1 подписчик
- вчера
- 113 просмотров
2

ответа
Linux

+3 ещё

Простой
Как вернуть обратно gnome 44 в Kali linux?
- 1 подписчик
- вчера
- 67 просмотров
0

ответов
Linux

+1 ещё

Средний
Astra Linux — как избавиться от шума в HDD?
- 2 подписчика
- вчера
- 334 просмотра
4

ответа
Linux

+2 ещё

Простой
Что выбрать для проекта Windows Embedded или Linux?
- 1 подписчик
- вчера
- 167 просмотров
4

ответа
Linux

+1 ещё

Средний
Как переименовать файлы и папки с одинаковым именем, но разным регистром?
- 1 подписчик
- вчера
- 112 просмотров
0

ответов
Linux

Простой
Почему не отрабатывает REISUB?
- 1 подписчик
- 18 апр.
- 67 просмотров
1

ответ
Показать ещё Загружается…

Программист C для Embedded Linux

Radiofid • Санкт-Петербург

от 120 000 до 180 000 ₽

Linux Администратор DevOps

ИМАГ • Москва

от 150 000 до 170 000 ₽

Программист C/C++ embedded Linux

РТК Автоматика • Москва

от 170 000 до 250 000 ₽

Доработать бота

20 апр. 2024, в 08:24

1500 руб./за проект

Разработать интранет сайт (корпоративный портал)

20 апр. 2024, в 07:24

100000 руб./за проект

Исправить адаптивную верстку на Tilda Zero Block

20 апр. 2024, в 06:39

4000 руб./за проект

Answer 1 · 2015-07-04 05:36:46

надо рассмотреть каждую ситуацию в частности.

1. если хост работает, но контрольная сеть упала и до него не достучаться. в таком случае будет stonith который для виртуалки ничем не будет отличаться от полноценного reset железа, или не будет ничего, пока админ сам не восстановит сеть (это уже зависит от настроек). типичный failover cluster в принципе сводит все сбои к упавшему железу и перезапуску сервисов на другом хосте, и плоха та виртуалка которая не способна пережить reset без серьезных потерь.

2. если хост упал, и виртуалку перезапустили на другом - в принципе она пострадала не более чем если бы бежала на том самом упавшем железе, плюс автоматический перезапуск. Короче сплошной профит, HA это все таки не FT

3. если упал сторедж - место кончилось, fabric отказал - не важно со стороны хоста или стореджа или свичей. любая проблема которая выдасть при попытке писать или читать виртуальный диск error (EIO, ENOSPACE если в терминах ядра). qemu-kvm в этом случае моментально отправляет VM в паузу, чтоб не генерировать IO и дополнительные сбои. Таким образом in flight IO замораживаются а не теряются. Чиним сторедж, выводим VM из паузы, и щсе продолжается как будто ничего не случилось.

Кстати, #3 это главная причина использования nfs hard mount под виртуалки, чтоб проблемы с доступом к дискам сразу отображались гипервизором а не уходили в буфер.

Answer 2 · 2015-04-09 09:16:10

Ситуация "хост издох" для сервера виртуалок - событие маловероятное (примерно такое же, как насильное выключение обычного сервера), так что не пускайте уборщицу в серверную и проблем не будет.

Answer 3 · 2015-04-09 09:44:02

Каким ещё кластерным по?
Вообще в облаке подразумевается что перезапуск инстанса не проблема, ну побилась фс сделали проверку и поехали, не поехали запустили новый и накатили сценарий или бекап со старого.

Как сделать кластер виртуалок QEMU/KVM безопасным для виртуалок?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт