Задать вопрос

d0ale3lfnd @d0ale3lfnd

машинное-обучение

Как лучше реализовать обучение с подкреплением?

Я выбрал Q-обучение для того, чтобы научить бота играть в крестики-нолики (спортивный интерес, хотя на самом деле это не имеет смысла)

У меня возникли сложность.
1) В виде чего хранить Q[s,a] ? Массив, словарь?
2) Предыдущее состояние - поле, до хода противника?
3) Текущее состояние - поле, после хода противника?

Вопрос задан более трёх лет назад
96 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Нейронные сети

Простой
Какие нейросети имеют доступ к страницам сайте в интернете?
- 1 подписчик
- 50 минут назад
- 10 просмотров
0

ответов
Аудио

+2 ещё

Простой
Какой программой можно сделать из текста рэп?
- 1 подписчик
- 2 часа назад
- 57 просмотров
1

ответ
IT-образование

+3 ещё

Простой
Какая есть литература полезная и понятная по Data Science на русском?
- 3 подписчика
- 17 апр.
- 978 просмотров
1

ответ
Нейронные сети

+1 ещё

Средний
Существует ли аналог GPTs?
- 3 подписчика
- 16 апр.
- 1047 просмотров
3

ответа
Нейронные сети

+1 ещё

Простой
Какие сейчас текстовые нейросети можно локально поставить?
- 1 подписчик
- 16 апр.
- 75 просмотров
1

ответ
Машинное обучение

+2 ещё

Простой
Создание нейронной сети для определения сортов яблок. Как осуществить?
- 1 подписчик
- 11 апр.
- 86 просмотров
0

ответов
Python

+2 ещё

Средний
Как преобразовать эмбеддинг текста в понятный сверточным слоям?
- 2 подписчика
- 05 апр.
- 72 просмотра
1

ответ
Машинное обучение

+1 ещё

Средний
Как работает адаптивный бустинг для регрессии?
- 1 подписчик
- 05 апр.
- 24 просмотра
0

ответов
Машинное обучение

+1 ещё

Средний
Чем отличается стекинг от блендинга?
- 1 подписчик
- 02 апр.
- 48 просмотров
1

ответ
Машинное обучение

+2 ещё

Простой
Что технически(какие it решения, технологический стек) нужны для создания ии ,который сможет на основе жалоб ставить диагноз?
- 1 подписчик
- 21 мар.
- 114 просмотров
3

ответа
Показать ещё Загружается…

Data Scientist (Финтех)

Intelinvest

от 60 000 ₽

Senior ML Engineer (Computer Vision)

Gradient

от 450 000 ₽

Python/Django-разработчик (mobile+AI)

4Taps AI • Тольятти

от 150 000 до 250 000 ₽

Разработать англоязычную версию корпоративного сайта на Statamic

20 апр. 2024, в 15:58

1500 руб./в час

Запись обучающих роликов и написание по машинному обучению

20 апр. 2024, в 15:40

3000 руб./за проект

Сделать 2 правки в веб-калькулятор стройматериалов

20 апр. 2024, в 15:38

10000 руб./за проект