Задать вопрос

Владимир Семенякин @semenyakinVS

Писатель кода и не только

gpgpu

Имеет ли смысл создать исполняющийся на GPU task-manager?

Пространное вступление

Я пока только начинаются разбираться с возможностями написания кода для GPU и в процессе чтения понял, что два главных ботлнека при работе с GPU это пересылка данных с CPU на видеоустройство и ветвления в коде кернелов, причём главный простой при ветвлениях происходит в варпах, когда один из потоков варпа выполняет ветвление, а остальные ждут прохождения соответствующей ветки кода.

Допустим, есть задача трассировки лучей. Каждый луч может отражаться и преломляться, порождая новые лучи. Происходит это при пересечении луча и поверхности - то есть, с ветвлением кода. Выполнение обработки отражённых и преломлённых лучей можно выполнять запуская рекурсивно функцию трассировки для новых лучей. Но это будет означать простой других потоков пока данный выполняется, и так для каждого из потоков в варпе. Выходит очень плохой для GPU, неоднородный код.

Исходя из этого подумал, что, возможно, было бы полезно написать что-то вроде исполняющегося прямо на GPU task-manager-а для выполнения подобных итеративных действий. С его помощью в местах просчёта лучей вместо полного алгоритма (как в примере - трассировки лучей) можно просто сохранить данные для выполнения трассировки нового луча, а трассировку выполнить когда обработаются все лучи текущей итерации (см. картинку).

Картинка

Вопрос, как я понимаю, сводится к следующему: нет ли какой-то возможности выполнить повторный запуск потоков на device-устройстве по окончанию текущего исполнения всех потоков без пересылки данных на host-устройство?

Вопрос задан более трёх лет назад
225 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

C#

+1 ещё

Простой
OpenCL в C# — какими средствами и где взять HelloWorld?
- 1 подписчик
- 22 апр.
- 60 просмотров
0

ответов
Blender

+3 ещё

Средний
Блендер требует OpenGL 4.6 от A2?
- 1 подписчик
- 16 мар.
- 82 просмотра
0

ответов
C#

+2 ещё

Сложный
Откуда возникает ошибка при gpu вычислений при увеличении числа данных, в ILGPU Cuda ускорителе?
- 1 подписчик
- 08 февр.
- 57 просмотров
0

ответов
C#

+3 ещё

Сложный
Gpu вычисления, groupId theradId gridId что означают, как пользоваться?
- 2 подписчика
- 01 февр.
- 95 просмотров
0

ответов
OpenCV

+1 ещё

Средний
Как в OpenCL изменить яркость пикселя?
- 1 подписчик
- 23 янв.
- 33 просмотра
0

ответов
C#

+2 ещё

Простой
Почему gpu вычисления ILGPU медленнее в 10 раз чем CPU?
- 1 подписчик
- 20 янв.
- 150 просмотров
1

ответ
Python

+2 ещё

Средний
Как запустить openCV на GPU?
- 1 подписчик
- 15 окт. 2023
- 212 просмотров
0

ответов
C++

+2 ещё

Средний
Как перебирать массив из 16 элементов 16 раз в c++ с подключением видеокарты?
- 2 подписчика
- 01 сент. 2023
- 274 просмотра
1

ответ
Python

+2 ещё

Средний
Как перебирать свой массив с помощю numba на cuda в питоне?
- 1 подписчик
- 01 сент. 2023
- 135 просмотров
0

ответов
OpenCV

+1 ещё

Средний
Почему возникает ошибка при работе с Python и OpenCV?
- 1 подписчик
- 30 июл. 2023
- 747 просмотров
2

ответа
Показать ещё Загружается…

Платформенный инженер

ИТ Плюс • Пермь

от 250 000 ₽

Senior Backend Engineer в агрегатор нейросетей (150к DAU)

NN Media

от 300 000 до 500 000 ₽

Тестировщик SberOs

Сбер • Санкт-Петербург

от 80 000 до 150 000 ₽

Приложение или модуль для Wordpress для учета поездок по QR

25 апр. 2024, в 03:58

10000 руб./за проект

Ошибка в 1с при выгрузке товаров на сайт на Битриксе

25 апр. 2024, в 03:08

3000 руб./за проект

Создание и публикация короткого (reels) UGC-видео на YouTube-канале

25 апр. 2024, в 01:46

500 руб./за проект