Перемножение матриц на PyCuda — с чем связан рост погрешности?

Question

mrgloom @mrgloom

Перемножение матриц на PyCuda — с чем связан рост погрешности?

Тестировав этот пример на pycuda, наблюдается рост погрешности с ростом размера матрицы (что теоретически логично, т.к. складывается большее кол-во float'ов).

т.е. np.allclose(c_cpu, c_gpu.get()) выдаёт false.

хотя я не понял это ограничение

40 # define the (square) matrix size
41 # note that we'll only use *one* block of threads here
42 # as a consequence this number (squared) can't exceed max_threads,
43 # see documen.tician.de/pycuda/util.html#pycuda.tools.De...
44 # for more information on how to get this number for your device
45 MATRIX_SIZE = 2

related : stackoverflow.com/questions/4104010/cuda-float-poi...

Вопрос задан более трёх лет назад
2998 просмотров

Комментировать

Подписаться 3 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 1

4 комментария

mrgloom @mrgloom Автор вопроса

а какая причина?

Написано более трёх лет назад
oleksandr_veles @oleksandr_veles

Выход из строя нескольких транзисторов из миллиардов в чипе или памяти (перегрев, утечки и т.п.) На то они и игровые для ширпотреба.
Не даром на тесла цены завышают внесколько раз.

Написано более трёх лет назад
mrgloom @mrgloom Автор вопроса

я не думаю, что это проблема железа, а проблема работы с числами с плавающей точкой. Хотя интересно как система знает, что устройство исправно.

Написано более трёх лет назад
oleksandr_veles @oleksandr_veles

Достаточно прогнать тест, чтобы исключить проблему в железе.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+1 ещё

Простой
Как получить имена параметров, которые будут переданы при нажатии на кнопку «зарегистрироваться»?
- 1 подписчик
- 6 минут назад
- 7 просмотров
0

ответов
Python

+3 ещё

Простой
Нужна помощь/совет — Telegram бот?
- 1 подписчик
- 3 часа назад
- 59 просмотров
1

ответ
Python

+1 ещё

Средний
Как победить варнинг There is no current event loop в юнитестах?
- 1 подписчик
- 4 часа назад
- 26 просмотров
0

ответов
Python

+1 ещё

Простой
Как работают рекурсии?
- 1 подписчик
- 5 часов назад
- 62 просмотра
3

ответа
Python

+3 ещё

Средний
Как запустить обучение с deepspeed у себя на пк?
- 2 подписчика
- 7 часов назад
- 143 просмотра
1

ответ
Python

+1 ещё

Простой
Как показать зависимость скорости от O(nlogn)?
- 1 подписчик
- вчера
- 77 просмотров
2

ответа
Python

Средний
Как из проекта на python RenPY сделать установщик?
- 1 подписчик
- вчера
- 61 просмотр
1

ответ
Python

+3 ещё

Простой
С чем и как есть gRPC?
- 1 подписчик
- вчера
- 77 просмотров
1

ответ
Python

+1 ещё

Простой
Как увеличить паузу между отправкой запроса и получением результата?
- 1 подписчик
- вчера
- 106 просмотров
3

ответа
Python

Простой
Как исправить проблему с установкой torch?
- 1 подписчик
- вчера
- 73 просмотра
0

ответов
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Необходимо сверстать приложение согласно макету Figma используя React

26 апр. 2024, в 22:22

1500 руб./за проект

Написать модуль подключения матрицы Sony к ПЛИС (Verilog)

26 апр. 2024, в 21:30

15000 руб./за проект

8266 f12 требуется сделать ревью и оптимизировать работу

26 апр. 2024, в 20:42

2000 руб./за проект

Answer 1 · 2014-05-30 15:38:45

Попробуйте прогнать с полчасика этот тест:
wili.cc/blog/entries/gpu-burn/gpu_burn-0.4.tar.gz

По моему опыту, игровые видеокарты спустя пару лет использования могут не проходить этот тест, иными словами, продолжая работать в игрушках, могут некорректно считать.

Перемножение матриц на PyCuda — с чем связан рост погрешности?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт