Как интерпретировать load average?

Question

DVoropaev @DVoropaev

Ставлю + к карме на хабре за ответы на вопросы

Как интерпретировать load average?

8 процессоров по 4 ядра в каждом

uptime выдает 4.42, 4.80, 4.71
zabbix выдает 0.68, 0.68, 0,67

как эти данные интерпретировать, и какой диапазон считать нормой?

Вопрос задан более трёх лет назад
950 просмотров

3 комментария

Подписаться 5 Простой 3 комментария

Пригласить эксперта

Ответы на вопрос 3

Комментировать

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Windows

+1 ещё

Сложный
"Boot Device Not Found" on HP laptop, как исправить?
- 1 подписчик
- 3 часа назад
- 75 просмотров
2

ответа
Android

+2 ещё

Простой
Есть ли какая нибудь платформа для управления андроид?
- 1 подписчик
- 4 часа назад
- 35 просмотров
1

ответ
Системное администрирование

+1 ещё

Простой
Проброс GPU на большое количество виртуальных машин, как?
- 4 подписчика
- 25 апр.
- 965 просмотров
4

ответа
Мониторинг

+1 ещё

Средний
Как мониторить систему на базе azure tables?
- 1 подписчик
- 25 апр.
- 16 просмотров
0

ответов
Сетевое администрирование

+1 ещё

Простой
Настроить wake on lan для AnyDesk?
- 6 подписчиков
- 24 апр.
- 7834 просмотра
3

ответа
Linux

+1 ещё

Средний
Как исправить ошибку «Meego grubby fatal error: unable to find a suitable template»?
- 1 подписчик
- 23 апр.
- 54 просмотра
1

ответ
Системное администрирование

+3 ещё

Простой
Есть работающий сервер с ProxMox, но как решить проблему с работой жестких дисков?
- 1 подписчик
- 23 апр.
- 203 просмотра
3

ответа
Linux

+1 ещё

Простой
Как создать свой образ Linux для размноживания на других АРМ?
- 1 подписчик
- 23 апр.
- 210 просмотров
4

ответа
Linux

+1 ещё

Простой
Как сделать автоматическую проверку работоспособности и рестарт Apache и Mariadb в случае падения?
- 1 подписчик
- 17 апр.
- 123 просмотра
2

ответа
Мониторинг

Простой
Как организовать dashbord Grafana Prometheus?
- 1 подписчик
- 17 апр.
- 32 просмотра
0

ответов
Показать ещё Загружается…

Инженер по системному администрированию

Деловая среда от Сбербанка • Москва

До 209 000 ₽

Системный администратор (инженер) 🚀

Хабр • Москва

от 140 000 ₽

Системный Администратор

DBI • Ростов-на-Дону

от 100 000 ₽

Парсер-робот под Desktop Windows на C# или .NET или WPF

27 апр. 2024, в 20:22

20000 руб./за проект

Разработчик Playable Ads (Unity)

27 апр. 2024, в 19:58

2500 руб./в час

Браузерное расширение

27 апр. 2024, в 19:48

10000 руб./за проект

Ещё очень хорошо вот здесь, с объяснением исторических причин
dableproger дорогой пользователь, настоятельно рекомендуем еще раз обратить самое пристальное внимание на п. 3.1 регламента работы сервиса (и, в особенности, на его последний абзац). В противном случае, ваши вопросы будут удаляться по причине тег-спама, а систематические нарушения приведут к блокировке учетной записи.

Answer 1 · 2018-08-25 06:27:03

Сложное объяснение, но видимо методически правильное есть в статье https://habr.com/company/mailru/blog/335326/
Как показывает практика - LA связан не только с вычислительной нагрузкой на CPU, но зависит и от ввода вывода и других факторов состояния системы.
При определенных обстоятельствах вполне можно наблюдать LA в несколько тысяч, при фактически не загруженных процессорах и обычном количестве и состоянии процессов.

Я для себя LA интерпретирую как комплексный показатель нагрузки на систему.
Упрощенно можно воспринимать как некий эфемерный показатель длины очереди процессов на исполнение - это условное заведомо неверное толкование, но вполне применимое в реальной работе.
Интерпретация значений LA:
Где значения от 0 до 1 указывают на не нагруженную систему близкую к простою.
Значения от 1 до 10 - как умеренно нагруженную систему. Все нормально.
Значения от 10 до 30 - как высоконагруженную систему. Не следует добавлять нагрузку. Можно подумать о поиске оптимизации нагрузки. Оптимизация рекомендуется.
Значения от 30 до 100 - как чрезмерно нагруженную систему, например, причиной может быть большая доля iowait из-за перегрузки - большое количество потоков ввода вывода на одно блочное устройство, аномально медленная работа блочного устройства из-за неисправности, другие подобные причины, связанные с возникновением "бутылочного горлышка" в системе, которое надо расшивать - при таких значениях LA - производительность неэффективная. Оптимизация необходима.
Значения выше 100 - следует воспринимать как аварийное состоянии системы с точки зрения производительности. Нужно принимать меры безотлагательно.
Значения выше 1000 - и дальнейший рост LA ведут к падению ядра, как правило, падение системы происходит в течении ближайших нескольких часов. Требуется экстренная реакция для избежания отказа систем и потери данных.
Границы указаны примерные на основе своего опыта.

Answer 2 · 2018-08-24 17:54:09

и какой диапазон считать нормой?

Смотрите на график. Если не выделяется на общем фоне и система работает нормально - значит это и есть норма для вашей системы.
Абстрактного значения нормы LA нет.

https://www.zabbix.com/forum/zabbix-troubleshootin...

Template OS Linux uses normalized CPU load (percpu), while top shows total load. Normalized load = total load divided by online CPU count.

У вас действительно 8-сокетная железка? 32 ядра в сумме? Вычисление немного не сходится просто.

Answer 3 · 2018-08-24 20:48:19

uptime выдает цифры для среднего в 1мин, 5мин и 15мин. число означает кол-во "съеденых" ядер в единницу веремни.
т.е. если у вас 8 рабочих ядер, и значение = 8, то процессор работает в 100% (т.е. процессора как раз хватает для задач, но нет запаса), если значение 4, то 50% нагрузки, если значение 16, то процессор работает в 100% и ещё столько же (ещё 100%) задач простаивает, ждет процессора, т.е. процессор не справляется в 2 раза и при большем кол-ве ядер задачи отрабатывали бы быстрее.

Как интерпретировать load average?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт