Почему Python multiprocessing нестабилен?

Question

Ольга Чёрная @OlBlack

Почему Python multiprocessing нестабилен?

Здравствуйте сообщество. Попытки разобраться с многопроцессорностью на питоне привели к серьезной загвоздке. Буду очень признательна за любую помощь в разборе проблемы, или за рекомендации по исправлению кода.
В программе для математических расчетов использую часть с multiprocessing. Параллельный блок кода выглядит так:

worker_count = multiprocessing.cpu_count()
        jobs = []
        print "---> Starting multiprocessing #", series_number
        for i in xrange(worker_count):
            s = solver.get_solution(copied_system)
            p = multiprocessing.Process(target=combinatorial_set.find_nearest_set_point, args=(s, result_queue))
            jobs.append(p)
            p.start()
            print p
        for w in jobs:
            w.join()
            print w
        results = []
        while not result_queue.empty():
            results.append(result_queue.get())
        for i in xrange(len(res)):
            print results[i], is_solution(copied_system, results[i])
            if is_solution(copied_system, results[i]):
                func_value = f(results[i])
                experiment_valid_points[func_value] = results[i]

        #End of parallel
        print "---> End of multiprocessing #", series_number

Вот что должен был делать данный код:
Проводится серия экспериментов. В рамках каждого эксперимента совершаются такие действия
1. Запуск эксперимента.
2. Генерация точек (s) в некоторой области. Количество точек = количеству ядер.
3. Запуск для каждой точки нахождения минимума функции. Эта часть выполняется параллельно.
4. Сбор результатов.
5. Выбор из сгенерированых точек лучшей.
6. Пересчет области для генерации.
7. Переход к новому эксперименту.

А вот что получается:
На практике данный код работает очень нестабильно. На одних и тех же данных могут быть следующие ситуации.
1. Первая "идеальная": в рамках каждого эксперимента запускается 4 python.exe которые каждый загружают ~ по 25% ЦП. После окончания эксперимента 3 из этих четырех процессов умирают и все начинается с начала.
2. Вторая "хуже" : в рамках каждого эксперимента запускается 4 python.exe но они выполняются псевдопараллельно. В мониторе ресурсов видно 4 процесса python.exe по одному потоку в каждом. В один момент времени работает всегда только один, остальные прерваны пока до них не дойдет очередь.
3. Третий "худший" : в консоли все 4 процесса отписываются Process(Process-i, started), но ни в диспетчере задач, ни в мониторе ресурсов 4 процессов нет. Есть только 1 python.exe, который загружает ~ 25% ЦП и не понятно что считает. Естественно работа дальше не идет, так как нужно дождаться завершения работы всех четырех процессов, а их просто не существует.

Заранее спасибо за ответы.

Вопрос задан более трёх лет назад
4395 просмотров

Комментировать

Подписаться 4 Оценить Комментировать

Решения вопроса 1

4 комментария

Ольга Чёрная @OlBlack Автор вопроса

Спасибо за подробный ответ. Если вдруг найдете ту вторую статью о которой писали пришлите пожалуйста.
С учетом всех рекомендаций по "готовке multiprocessing под Windows" я делаю вывод что лучше эту идею забросить. Кроме одной, которая у меня появляется - установить линукс и попробовать побороться там. Как считаете, стоит ли?

Написано более трёх лет назад
Ольга Чёрная @OlBlack Автор вопроса

Уважаемый nirvimel , еще вопрос в догонку. Как думаете, стоит ли попытаться в данном случае ту часть, которую хочется параллелить переписать под Cyton? Или использование цитона выгодно для написания, как вы говорили "мелочи"?

Написано более трёх лет назад
Bkmz @Bkmz

Ольга Чёрная: Cython даст производительности только при вычислении различной "математики" в Python. Если solver.get_solution - это блокирующая операция, которая обращается по сети или по диску то большого смысла в этом не будет.
А если эта функция вычисления различных мат. функций, численное интегрирование или что-то из этой оперы - то да, должно помочь. Но нужно учитывать, а) что под будет куча Windows специфичных проблем б) затраты по времени(а они будут не маленькие) не должны перевешивать "полученную производительность"

Написано более трёх лет назад
nirvimel @nirvimel

Bkmz: Смысл использования Cython, в данном случае, в том, что он позволяет освобождать GIL. При этом приобретает смысл использование стандартного threading, который под GIL бесполезен в смысле распараллеливания вычислений. С этой точки зрения, применение Cython возможно рассматривать как альтернативу multyprocessing.

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

3 комментария

Ольга Чёрная @OlBlack Автор вопроса

Изначально данный проект не подразумевал параллельных вычислений. Это были математические рассчеты, для которых Python+Numpy очень хорошо подходит. После того как все было написано возникла идея попробовать распараллелить то что можно, но тут питон подсунул такую бяку.
Я все же хотела попытаться, но видимо придется отказаться от этой идеи.
Была еще мысль ту часть которую хочется распараллелить написать под С++ и вызывать из питона. Даже вроде есть такая возможность с библиотекой Cyton. О ней недавно была статья на хабре. Но это казалось просто для небольших функций, а для целого метода, который внутри вызывает другие методы это ой-ой.

Написано более трёх лет назад
Олег Цилюрик @Olej

Ольга Чёрная:
Это были математические рассчеты, для которых Python+Numpy очень хорошо подходит.

Для трудоёмких математических вычислений Python далеко не так хорошо подходит ... до 100 раз по скорости можете потерять.

Даже вроде есть такая возможность с библиотекой Cyton.

Есть разные способы, довольно много, скрестить Python и C/C++.
См. :
Тонкости использования языка Python: Часть 6. Спос...
Тонкости использования языка Python: Часть 7. Особ...
Тонкости использования языка Python: Часть 8. Особ...

Написано более трёх лет назад
Ольга Чёрная @OlBlack Автор вопроса

Олег Цилюрик: Спасибо, внимательно ознакомлюсь. Дело в том что исходный проект писался в 2 этапа, двумя разными людьми. Первый был питонист и у него стояла задача такая же как и у меня, но поиск минимума функции для одной точки(то что я хочу распараллелить) находился в одну строчку, а основная проблема была в обсчете системы линейных ограничений размерности n+1, к которой в начале каждой серии экспериментов добавляется одно ограничение. И для нахождения фундаментального решения этой системы как раз видимо питон с нампи подходили, плюс человек знал питон.
После чего я добавляла к этому проекту свою часть, которая, да, наверное не лучший вариант считать на питоне.
Еще раз спасибо за ссылки, пойду скрещивать питон с с++))

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Windows

+1 ещё

Средний
Почему ноутбук не видит nvme ssd m.2?
- 1 подписчик
- 54 минуты назад
- 18 просмотров
1

ответ
Python

+1 ещё

Простой
Как показать зависимость скорости от O(nlogn)?
- 1 подписчик
- 9 часов назад
- 48 просмотров
2

ответа
Python

Средний
Как из проекта на python RenPY сделать установщик?
- 1 подписчик
- 12 часов назад
- 46 просмотров
0

ответов
Windows

+1 ещё

Простой
По какой причине ошибка «NET-BroadcastEvenWindow»?
- 1 подписчик
- 13 часов назад
- 23 просмотра
0

ответов
Python

+3 ещё

Простой
С чем и как есть gRPC?
- 1 подписчик
- 14 часов назад
- 56 просмотров
1

ответ
Windows

+3 ещё

Простой
Как печатать через интернет с iphone на usb принтер подключенный к windows 7?
- 1 подписчик
- 15 часов назад
- 75 просмотров
1

ответ
Python

+1 ещё

Простой
Как увеличить паузу между отправкой запроса и получением результата?
- 1 подписчик
- 18 часов назад
- 88 просмотров
2

ответа
Python

Простой
Как исправить проблему с установкой torch?
- 1 подписчик
- 21 час назад
- 60 просмотров
0

ответов
Python

+1 ещё

Средний
Как навести мышь внутри приложения?
- 1 подписчик
- 23 часа назад
- 46 просмотров
0

ответов
Python

+1 ещё

Простой
Как пройти авторизацию на youtube с помощью selenium?
- 1 подписчик
- вчера
- 67 просмотров
2

ответа
Показать ещё Загружается…

Python developer

Bell Integrator

До 350 000 ₽

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

TeamLead Python

AGIMA • Москва

До 350 000 ₽

Найти ошибку flutter_map

26 апр. 2024, в 05:31

1000 руб./за проект

Разработать электронику для весов с Wi-Fi

26 апр. 2024, в 01:22

1000 руб./в час

Очень срочно нужно помочь запустить программу с UI

26 апр. 2024, в 00:13

1000 руб./за проект

Answer 1 · 2016-01-06 05:45:34

Хорошо, что вы указали в тегах Windows, это все объясняет. Под Windows нет простого способа "раздвоиться" процессу при вызове multiprocessing.Process, поэтому осуществляется очень сложная эмуляция этого поведения. При этом функция target выдирается из модуля, запускается в отдельном интерпретаторе, а все параметры сереализуются передаются и десереализуются перед вызовом target, при этом инициализация модуля в новом интерпретаторе выполняется частично (инициализируется только глобальный контекс). Подробнее об этом, например, тут, есть еще одна очень хорошая статья где подробно рассмотрен этот механизм, но сейчас не найду ссылку.

Коротко о том, как готовить multiprocessing под Windows:

Разделять процессы (вызов multiprocessing.Process()) как можно раньше в коде.
По возможности избегать инициализации любых ресурсов и глобальных переменных до разделения. Учитывайте, что этот код выполняется во всех процессах независимо и может давать кучу сторонних эффектов.
Не передавать через args никаких сложных объектов с "поведением" (кроме объектов из самого multiprocessing, он сам знает как их правильно передавать), только голые данные (примитивы или объекты состоящие только из примитивов), которые сериализуются без сторонних эффектов.
Создавать дочерние процессы один раз, и на протяжении всего времени работать с ними посредством обмена сообщениями через Pipe/Queue. Не порождать новые процессы в цикле вычислений в момент "когда понадобятся".
Queue при попытке записи/чтения может блокировать процесс, если при этом происходит запись/чтения в/из нее в другом процессе. (Думаю, именно это и происходит в коде в вопросе).
Лучше использовать Pipe, который в худшем случае блокирует один процесс, а не все, как Queue.
При создании процесса можно передавать ему два Pipe (input одного + output другого), в вызывающем процессе хранить соответствующие им коннекторы и только при помощи их общаться с дочерним процессом.
Можно не делать process.join(), а просто читать результаты из output Pipe, они прочтутся только после того как попадут туда, что дальше будет происходить с процессом уже не важно (можно поставить return после записи в Pipe в дочернем процессе).

Answer 2 · 2016-01-06 02:16:49

3. Третий "худший"

1. Что-то мне кажется, что в вот этом target=combinatorial_set.find_nearest_set_point - у вас должна быть критическая ошибка, которая просто убивает процессы.

Что на размерности 30 превращается в адову кучу действий.

2. Чего же вы при этом делаете это на Python? Вы при этом теряете раз 100 в производительности, в сравнении с языками, компилирующими в нативный код (C, C++, Go). Тем более, что там бы вы имели возможность использовать легковесные потоки взамен тяжёлых параллельных процессов.

Почему Python multiprocessing нестабилен?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт