Как работает эта деталь в градиентном спуске?

Question

Dplll @adelshin23

Как работает эта деталь в градиентном спуске?

# cделать шаг градиента
def step(v,direction, step_size):
   """Двигаться с шаговым размером step_size в направлении от v"""
     return [v_i + step_size*direction_i  for v_i, direction_i in zip(v, direction)]

Как это работает?direction в нашем случае градиент.Зачем из v_i вычитать произведение частной производной и размера шага?

Вопрос 2: Зачем в стохастическом спуске растасовывают данные?

Вопрос задан более трёх лет назад
120 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+1 ещё

Средний
Бот не реагирует на заданные команды?
- 1 подписчик
- час назад
- 16 просмотров
0

ответов
Python

Простой
Сохраняется ли куда-то скриншот в Pyautogui?
- 1 подписчик
- час назад
- 19 просмотров
1

ответ
Python

+2 ещё

Простой
Как получить список приглосительных ссылок в телеграм канале?
- 1 подписчик
- 8 часов назад
- 14 просмотров
0

ответов
Python

Простой
Пишу Todolist появилась ошибка, как исправить?
- 1 подписчик
- 11 часов назад
- 35 просмотров
1

ответ
Python

+1 ещё

Простой
Как решить проблему с терминалом PyCharm?
- 1 подписчик
- 12 часов назад
- 35 просмотров
0

ответов
Python

+2 ещё

Средний
Как пофиксить ошибку с сертификатом при работе с selenium?
- 1 подписчик
- 13 часов назад
- 17 просмотров
0

ответов
Python

+2 ещё

Средний
Возможно ли сделать так, чтобы Telegram GPT-Yandex.Cloud Бот отвечал не только на текстовые сообщения, но и на картинки? И если да, то как?
- 1 подписчик
- 13 часов назад
- 44 просмотра
2

ответа
Python

Средний
Как выполнить авторизацию MS CHAP 2?
- 1 подписчик
- 15 часов назад
- 31 просмотр
0

ответов
Python

+1 ещё

Простой
Как вычислить количество записей?
- 1 подписчик
- 19 часов назад
- 67 просмотров
2

ответа
Python

+1 ещё

Простой
Почему при использование webdriverIE все равно открывается EDge?
- 1 подписчик
- 21 час назад
- 16 просмотров
0

ответов
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Нужен опытный Фронтенд разработчик

20 апр. 2024, в 09:47

6000 руб./за проект

Тестовое приложение для коннекта по SIP

20 апр. 2024, в 09:15

8000 руб./за проект

Сканер коэффициентов в букмекерских конторах

20 апр. 2024, в 08:39

100000 руб./за проект

Answer 1 · 2018-02-11 14:24:27

1 - нарисуйте картинку для одномерного случая. Градиент превратится в обычную производную. Производная - это угол наклона касательной к нашей cost функции. Получается на этом шаге мы смотрим возрастает функция или нет (производная больше или меньше) и в зависимости от этого смещаемся в сторону, где функция меньше на размер шага(отсюда и название - градиентный спуск, мы спускаемся к минимуму функции используя градиент как направление). Для многомерного случая все так же, мы по сути делаем это для каждой переменной.
2 - чтобы не попасть на локальный минимум

Answer 2 · 2018-02-12 09:32:01

2 - в части исходных данных может быть какая-то дополнительная структура, которая и правда приведет нас к локальному минимуму. Например, если какие-то N примеров подряд имеют примерно одинаковые входные или выходные данные, то тогда модель обучится, что данные только такого характера и есть в принципе, и ей сложнее будет "расстаться" с этим знанием при обучении на следующих примерах.

Как работает эта деталь в градиентном спуске?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт