Как сейчас выглядит нормальная система сборки / мониторинга?

Question

EchoStan @EchoStan

Как сейчас выглядит нормальная система сборки / мониторинга?

Здравствуйте! Веб-роект в котором тружусь, развивается и стало у нас как-то тяжко с системой развёртывания. Сейчас раскатываюсь shell-скриптами по ssh, собирая проект из нескольких гит-репо (фронт, бэк, пара лендингов и тд, лежащих отдельно), и сохраняя коммитом в отдельную ветку новую сборку перед деплоем.

Окружение самое простое, несколько голых vps с ubuntu от DO. Там крутится нода под присмотром pm2, между собой сервисы общаются по tcp. Да, не монолит. Периодияески одной из убунт хочется больше внимания и она обеспечивает мне пару незабываемых часов.

При ошибке в тестировании на препрод- инстансах (на которое иногда, конечно, кладется болт) или любых других проблемах со сборкой я ничем не защищён, не могу даже востановить предыдущую сборку и окружение в точности - ибо нет виртуализации/контейнеризации и состояние ОС меняется от сборки к сборке (пример - новая зависимость, требующая глобальной установки).

С ностальгией вспоминаю времена, когда приложение было маленьким MVP и хостилось на PaaS heroku.

Пожалуйста, подскажите к каким инструментам начинать читать спеку в первую очередь? Хочу позаимствовать у heroku фичу "безопасной авто сборки по пушу в мастер с автороллбэком при любой проблеме". И с командой "откатиться вот к этой сборке" которая на Heroku даже выведена в
GUI.

Чем сейчас умные люди пользуются, когда решают такие задачи? Направление мыслей следующее:

- Health checking слоя бизнес-логики. Сейчас все ограничивается pm2, который перезапускает упавшее приложение и сам стоит в автозагрузке ОС хоста. Хотелось бы связать health checking с развертыванием, чтоб откатываться автоматом если приложение поднимается криво, а среда - в порядке. Сейчас я вручную реагирую на алерты в телеграм от Uptime Robot.

- Docker для контейнеризации. Версионируемый итоговый образ должен включать в себя только мой код или еще и какой-нибудь node:latest (который, вроде, сам включает debian)? В последнем случае образ будет весить 900мб, при объеме клиентского кода в сотни кб - смешно. По идее, надо хранить только инструкции для docker, да? Это dockerfile в моем случае?

- Собственно, версионирование на основе гит-репо с исходным кодом и образом / инструкциями для docker. Писать скрипт для управление этим добром самому и запускать в отдельном vps или разбираться с каким-нибудь gitlab?

Как решать проблемы с самим хостом, если ОС вдруг устанет? Есть какие-то средства для мониторинга, которые могут перезагрузить / пересоздать VPS (хостинг сейчас do, но мы не привязаны).

Знаю, что в мире есть chef, puppet, k8s (и managed k8s, хех). Что-то из этого отвечает задаче на 100%, чтоб сконцентрироваться на изучении и за 2-3 недели получить продакшн-риди результат? Учусь быстро.

Вопрос задан более трёх лет назад
383 просмотра

11 комментариев

Подписаться 3 Средний 11 комментариев

EchoStan @EchoStan Автор вопроса

Забыл. Если мы пересоздаем VPS и он получает новый IP в локалке (private network), нужно передать этот IP в env для других сервисов. Получается, нужен какой-то централизованный env для моих скриптов?

Написано более трёх лет назад
hOtRush @hOtRush

Мне кажется вашей задаче отвечает любые инструменты для автоматизации развертывания, будь-то богом забытый chef, ansible или что-то еще. Если хоститесь в ДО есть смысл наверное попробовать их кубернетес сервис, это сейчас самое популярное решения для инфраструктуры, правда ее итоговая стоимость вырастет на порядок.

Либо посмотреть в сторону aws, у них есть например штука для развертывания elastic beanstalk, да и вообще есть практически все что надо для любого приложения, включая тот же кубернетес) К тому же у авса есть хорошие программы для стартапов, нам например давали 20к на два года на попробовать без каких-либо обязательств.

Написано более трёх лет назад
EchoStan @EchoStan Автор вопроса

hOtRush, а за счет чего растет итоговая стоимость при использовании k8s? Только из-за тарифов do?

Написано более трёх лет назад
hOtRush @hOtRush

EchoStan, насчет managed от do не знаю, не трогал. А в целом, просто инфраструктура становится сложнее, появляется больше элементов чем node+pm2, больше элементов - больше ресурсов.

Написано более трёх лет назад
Vitaly Karasik @vitaly_il1

EchoStan, прошу прощения что влезаю.

ИМХО, основные затраты на K8S это время - на изучение, имплементацию, отладку и т.д.
Не думаю, что при правильной архитектуре это удорожит инфраструктуру. Конечно если мы не говорим от ситуации, когда "сегодня все бежит на одном сервере за $10"

Написано более трёх лет назад
chupasaurus @chupasaurus

hOtRush, EchoStan, стоимость managed k8s в DO = стоимость рабочих узлов (на которых крутятся приложения, запускаемые в кластере), мастер-узлы с etcd предоставляет хостинг бесплатно (а они внезапно жрут больше и с жёсткими требованиями по отказоустойчивости).
Пример потребления ресурсов кластерными процессами на узле одного живого кластера: до 40% одного ядра Xeon на 2.3ГГц суммарно на всё нижеперечисленное, оперативка: kubelet - 450МБ (на узле 70 подов/137 контейнеров, больше подов → больше горутин → больше памяти), dockerd - 120МБ, calico - 96МБ, отправитель логов - 100МБ, итого чуть меньше 800. Всё остальное будет в вашем полном распоряжении (до той поры, пока oomkiller не разлучит вас).

Написано более трёх лет назад
EchoStan @EchoStan Автор вопроса

chupasaurus, спасибо, что и здесь поделились опытом. С меня тогда новый глупый вопрос: если несколько контейнеров с разными сервисами проекта живут на одном VPS DO, больше ли вероятность падения всего сразу из-за падения ОС? Или это из области фантастики. Сейчас 7-15 сервисов раскиданы по $5 VPS

Написано более трёх лет назад
EchoStan @EchoStan Автор вопроса

hOtRush, Vitaly Karasik, в таком случае вопрос немножко холиварный - а я потяну вообще managed k8s и облегчит ли он мою участь? И так уже фуллстечу этот проект (веб, 120-150к строчек суммарно) в одно лицо. В принципе, нормальная для меня нагрузка, но хочется бонусов от автоматизации в краткосрочной перспективе, хотя бы через 2-3 месяцы.

Написано более трёх лет назад
Vitaly Karasik @vitaly_il1

EchoStan, Честно говоря, не знаю. Мой стандартный ответ на большинство вопросов "зависит".

больше ли вероятность падения всего сразу из-за падения ОС

Нет. K8S умеет переносить аппликации на здоровый node (server) в таком случае.

а я потяну вообще managed k8s и облегчит ли он мою участь?

Я бы начал с "маленьких шагов" - без K8S, просто сделать более надежный CI/CD, с rollback и т.д.
Это возможно и без контейнеров.
Насчет автоматического rollback - можно деплоить предыдущую версию по тому же алерту.

Написано более трёх лет назад
chupasaurus @chupasaurus

EchoStan, Если на голом докере и без прописывания различных ограничений у контейнеров (ротация логов, CPU, память), то вероятность есть.

Написано более трёх лет назад
EchoStan @EchoStan Автор вопроса

Vitaly Karasik, спасибо, для начала тогда буду тренироваться собирать версионируемые образы. Все-таки идея контейнеризации нравится.

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 3

3 комментария

EchoStan @EchoStan Автор вопроса

chupasaurus , здравствуйте и спасибо за развёрнутый ответ.

1) Метрика уже бинарная, чекеры бизнес-логики, consistency т.д. обёрнуты в http. Что посоветуете для первых домашних поделок с k8s, докер или cri-o? Мнения коммьюнити я не понял, тенденции на замещение тоже не уловил.

2) и 3) Посчёт Registry. Я так понял это вполне живой пакетный-менеджер с vcs. Почему-то сначала показалось, что by default он открытый всему миру, а не in-house. Но, думаю, умеет же быть приватным, да? Наверное, глупый вопрос.

4) и 5) Насколько слышал, docker умеет разруливать запросы между контейнерами, а несколько контейнеров на разных машинах объединяются нативно средствами docker или это уже к k8s?

6) Самый важный вопрос: контейнеризовано == обёрнуто в docker-образы? Пока кажется, что k8s будет хорошей серебряной пулей, лишь бы не оказалось у неё слишком вязкого сердечника =)

Ещё раз спасибо!

Написано более трёх лет назад
chupasaurus @chupasaurus
EchoStan,
Cri-o чуть более легковесный и избавляет от ряда сложностей с Docker. Используйте что нравится, сам рантайм можно поменять. Я только из любопытства дёргал информацию из рантайма, сам к8с позволяет забыть о его существовании после установки (этот процесс меняется в зависимости от того, что на хостах).
Docker Registry естественно может быть self-hosted. Мы у себя пользуемся Harbor, проблем не испытывали. Едлинственный момент - актуальная версия API требует TLS, а значит валидного сертификата.
Docker как runtime - разруливает всё внутри одного хоста, оркестраторы Docker Swarm/k8s - на уровне кластера.
Это означает "приложение собирается и запускается в виде контейнера".
Написано более трёх лет назад
EchoStan @EchoStan Автор вопроса

chupasaurus, Спасибо, буду копать!

Написано более трёх лет назад

4 комментария

hOtRush @hOtRush

Честно говоря я бы не советовал какие-то платные ноунейм решения от каких-то российских ноунейм разработчиков, особенно когда в 2019 просто гигантский выбор решений для мониторинга, будь то elk-стэк, zabbix, grafana или что-то еще.

Ну и ~600/20 как бы наводит на мысль что сайтики по 30 штук на сервер мониторить одно, а большой распределенный проект - другое

Написано более трёх лет назад
Виктор Таран @shambler81

hOtRush,
соотношение цена-качество и уровень входа как всегда ;(
Мне к примеру grafana не нравится, у меня все скрипты свои порой очень специфические, ну и полу интелектуальные решения для востановления работоспособности.
Скорее по 100 на сервера, а вот остальные там уже в зависимости от проекта, принципиально не держу говножелезо
И опять же вопрос должен быть в первую очередь коммерчески обоснован
В задаче ничего не стоит о объемах, однако я сразу написал что "большие проекты" а это не 20К в день, действительно нужно мониторить достаточно серьезно.
Но я не думаю что человек у которого есть сервис с 300К в день, спрашивает чем простеньким ему мониторить сервера.
zabbix хорош но для двух серверов смысл от него какой?

Написано более трёх лет назад
EchoStan @EchoStan Автор вопроса

Виктор Таран, Здравствуйте, у меня, пожалуй, основная проблема в связывании развертывания и мониторинга.

Написано более трёх лет назад
Виктор Таран @shambler81

EchoStan, оснавная задача мониторинга это стабильность !!!
если он не стабилен толку от него даже самого крутого нет
как следствие это
1. незвисмыый сервер, желательно облако !
2. собственно сами настройки.
Если вы опишете размер проекта то будет проще выбрать решение.
Так же что именно вам нужно мониторить
Вот мне важно например на одном сервере где 200 сатов мониторить валидность выдачи https сертификатов Letseycrypt для сайтов заблаговременно выдавать алиард в случае проблеммы.
А для другого проекта мне нужно мониторить соответствие кода 200 , и не нулевого размера файла изображений пришедших с выгрузкой и даже при условие валидного завершения.
В общем от задач плясать тоже приходится.

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

GitLab

Простой
Как настроить отображение кириллицы (CP866) в Gitlab?
- 1 подписчик
- 10 часов назад
- 28 просмотров
0

ответов
Системное администрирование

+1 ещё

Простой
Проброс GPU на большое количество виртуальных машин, как?
- 4 подписчика
- вчера
- 531 просмотр
4

ответа
Сетевое администрирование

+1 ещё

Простой
Настроить wake on lan для AnyDesk?
- 6 подписчиков
- 24 апр.
- 7114 просмотров
3

ответа
Linux

+1 ещё

Средний
Как исправить ошибку «Meego grubby fatal error: unable to find a suitable template»?
- 1 подписчик
- 23 апр.
- 54 просмотра
1

ответ
Системное администрирование

+3 ещё

Простой
Есть работающий сервер с ProxMox, но как решить проблему с работой жестких дисков?
- 1 подписчик
- 23 апр.
- 201 просмотр
3

ответа
Linux

+1 ещё

Простой
Как создать свой образ Linux для размноживания на других АРМ?
- 1 подписчик
- 23 апр.
- 209 просмотров
4

ответа
GitLab

+1 ещё

Простой
Как правильно настроить yaml файлик?
- 1 подписчик
- 18 апр.
- 54 просмотра
0

ответов
Linux

+1 ещё

Простой
Как сделать автоматическую проверку работоспособности и рестарт Apache и Mariadb в случае падения?
- 1 подписчик
- 17 апр.
- 122 просмотра
2

ответа
Docker

+1 ещё

Простой
Как замаскировать переменную внутри контейнера?
- 1 подписчик
- 17 апр.
- 104 просмотра
2

ответа
Windows

+1 ещё

Средний
Как открыть экранную клавиатуру в режиме киоска?
- 1 подписчик
- 15 апр.
- 178 просмотров
1

ответ
Показать ещё Загружается…

Инженер по системному администрированию

Деловая среда от Сбербанка • Москва

До 209 000 ₽

Системный администратор (инженер) 🚀

Хабр • Москва

от 140 000 ₽

Системный Администратор

DBI • Ростов-на-Дону

от 100 000 ₽

Необходимо сверстать приложение согласно макету Figma используя React

26 апр. 2024, в 22:22

1500 руб./за проект

Написать модуль подключения матрицы Sony к ПЛИС (Verilog)

26 апр. 2024, в 21:30

15000 руб./за проект

8266 f12 требуется сделать ревью и оптимизировать работу

26 апр. 2024, в 20:42

2000 руб./за проект

Забыл. Если мы пересоздаем VPS и он получает новый IP в локалке (private network), нужно передать этот IP в env для других сервисов. Получается, нужен какой-то централизованный env для моих скриптов?
Мне кажется вашей задаче отвечает любые инструменты для автоматизации развертывания, будь-то богом забытый chef, ansible или что-то еще. Если хоститесь в ДО есть смысл наверное попробовать их кубернетес сервис, это сейчас самое популярное решения для инфраструктуры, правда ее итоговая стоимость вырастет на порядок.

Либо посмотреть в сторону aws, у них есть например штука для развертывания elastic beanstalk, да и вообще есть практически все что надо для любого приложения, включая тот же кубернетес) К тому же у авса есть хорошие программы для стартапов, нам например давали 20к на два года на попробовать без каких-либо обязательств.
hOtRush, а за счет чего растет итоговая стоимость при использовании k8s? Только из-за тарифов do?
EchoStan, насчет managed от do не знаю, не трогал. А в целом, просто инфраструктура становится сложнее, появляется больше элементов чем node+pm2, больше элементов - больше ресурсов.
EchoStan, прошу прощения что влезаю.

ИМХО, основные затраты на K8S это время - на изучение, имплементацию, отладку и т.д.
Не думаю, что при правильной архитектуре это удорожит инфраструктуру. Конечно если мы не говорим от ситуации, когда "сегодня все бежит на одном сервере за $10"
hOtRush, EchoStan, стоимость managed k8s в DO = стоимость рабочих узлов (на которых крутятся приложения, запускаемые в кластере), мастер-узлы с etcd предоставляет хостинг бесплатно (а они внезапно жрут больше и с жёсткими требованиями по отказоустойчивости).
Пример потребления ресурсов кластерными процессами на узле одного живого кластера: до 40% одного ядра Xeon на 2.3ГГц суммарно на всё нижеперечисленное, оперативка: kubelet - 450МБ (на узле 70 подов/137 контейнеров, больше подов → больше горутин → больше памяти), dockerd - 120МБ, calico - 96МБ, отправитель логов - 100МБ, итого чуть меньше 800. Всё остальное будет в вашем полном распоряжении (до той поры, пока oomkiller не разлучит вас).
chupasaurus, спасибо, что и здесь поделились опытом. С меня тогда новый глупый вопрос: если несколько контейнеров с разными сервисами проекта живут на одном VPS DO, больше ли вероятность падения всего сразу из-за падения ОС? Или это из области фантастики. Сейчас 7-15 сервисов раскиданы по $5 VPS
hOtRush, Vitaly Karasik, в таком случае вопрос немножко холиварный - а я потяну вообще managed k8s и облегчит ли он мою участь? И так уже фуллстечу этот проект (веб, 120-150к строчек суммарно) в одно лицо. В принципе, нормальная для меня нагрузка, но хочется бонусов от автоматизации в краткосрочной перспективе, хотя бы через 2-3 месяцы.
EchoStan, Честно говоря, не знаю. Мой стандартный ответ на большинство вопросов "зависит".

больше ли вероятность падения всего сразу из-за падения ОС

Нет. K8S умеет переносить аппликации на здоровый node (server) в таком случае.

а я потяну вообще managed k8s и облегчит ли он мою участь?

Я бы начал с "маленьких шагов" - без K8S, просто сделать более надежный CI/CD, с rollback и т.д.
Это возможно и без контейнеров.
Насчет автоматического rollback - можно деплоить предыдущую версию по тому же алерту.
EchoStan, Если на голом докере и без прописывания различных ограничений у контейнеров (ротация логов, CPU, память), то вероятность есть.
Vitaly Karasik, спасибо, для начала тогда буду тренироваться собирать версионируемые образы. Все-таки идея контейнеризации нравится.

Answer 1 · 2019-07-25 14:32:24

Много вопросов, много ответов.

Health checking - метрики на проверку выводить по отдельному URL и мониторить. Если есть возможность сделать бинарную метрику, отдающую HTTP 200/500, то в докер/cri-o/прочие рантаймы сами умеют отслеживать статус.
Docker-образ состоит из манифеста, в котором описываются экспортированные порты, анонимные тома и метаданные, а самое главное - список слоёв с данными. При обновлении с использованием Docker Registry вместо копирования блоба уже присутствующие слои скачиваться не будут.
IaaC же. Dockerfile + билдскрипты если надо в коде + сборочная система. Образы хранить в Registry крайне удобно, можно задавать теги по id коммита если надо прям прибивать к VCS.
Есть 2 путя: внешний мониторинг + система управления конфигурациями (первая пушит по алерту во вторую, которая создаёт сбоку новый сервер и глушит сбойный) или оркестратор, который сам разруливает подобные проблемы.
Про введение новых серверов: env ни разу не динамический, для этой цели используют динамические DNS-сервера (оборачивая красивым названием Service Discovery), балансировщики и очереди сообщений.
Примеры решений из личной практики. Без оркестратора: в AWS можно реализовать на SNS + Autoscaling, универсально - на Prometheus/Alertmanager или Zabbix или Nagios, которые будут запускать алертами джобы в Ansible Tower (его опенсурс версия AWX идёт со всеми фишками Enterprise-версии), но лучше всё же иметь что-то между для большего контроля над происходящим. С k8s всё проще: под Prometheus уже всё есть, сама система отслеживает потребление ресурсов и можно задавать лимиты по процу/оперативной памяти, только настроить масштабируемость рабочих узлов, но есть маленький ньюанс - у вас всё уже должно быть контейнеризовано; в DO кстати весьма адекватный managed кластер.

Answer 2 · 2019-07-25 11:21:34

monit-it.ru
Для старта пойтет вот это
из особенностей
поддержка плагинов nagios
и главное, подключается по ssh и может выполнить команду вернуть себе код сделать выводы.
Ну и особо важное при алиарде можно выполнить консольную команду.
А главное это хрень облачное и не нужно следить за самой системой мониторинга.
Для мониторинга инфроструктуры яндекс явно не пойдет, а вот для своих проектов нормально.
Я монитрю в ней окол 20 серверов, 600 сайтов, в принципе хватает.
А главное как вы и просили минимальный уровень входа.

Answer 3 · 2019-08-01 00:38:40

1. Положить всё в докер. Гуглятся турториалы минимальных контейнеров alpine в зависимости от фреймворка
2. Тесты делать без деплоя в каком-нибудь gitlab-ci
3. Оркестрация самая простая swarm из коробки самого докера

зы 2-3 недели маловато будет))

Как сейчас выглядит нормальная система сборки / мониторинга?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт