С чего начать обучение бота на нейронной сети?

Question

Vitaliy @Ni55aN

С чего начать обучение бота на нейронной сети?

Рассматривал множество примеров с нейронными сетями, но это были довольно простые примеры, поэтому для текущей задачи - обучить бота играть в футбол - нет ясного представления, какие для этого нужны входные параметры.
Модель игры очень простая: поле, две команды по 3 чел. и один мяч, каждый объект из которых - окружность с определенным радиусом и массой.

У каждого объекта есть такие управляемые параметры как ускорение и направление (за исключением мяча, он перемещается под воздействием внешних объектов)
Каждый игрок может знать о мяче, тиммейтах и противниках.

Тупые боты в пару строк умеют двигаться только прямо к мячу. Была попытка добавить различное поведение с помощью условных операторов, например:
если защитник, не отходить далеко от ворот
если нападающие, оставаться в середине поля если уже два тиммейта у наших ворот
если мяч катится в сторону наших ворот, обограть его сбоку и выбить

С таким поведением уже лучше, но дальше все только усложняется при попытке добавить новые поведения так, чтобы не сломать предыдущие.

Что касается нейронных сете, как уже было сказано, находит только простые примеры, где очевидно какие параметры нужно. А для подобного бота какие?
На выходе нужно знать только то в каком направлении двигаться и с каким ускорением
На входе можно получить: свою позицию, позицию и направление мяча, позицию тиммейтов и оппонентов (соответственно из этого можно выделить такие данные: угол направления к мячу, количество тиммейтов и противников рядом в некотором радиусе, тиммейты или оппоненты, ведущие мяч)

Как это грамотно подать в сеть, чтобы не было какой-то привязанности к определенному положению на поле, и иметь разные поведения для защитника/нападающего (нужно ли разделять на две сети?)

Вопрос задан более трёх лет назад
1986 просмотров

Комментировать

Подписаться 5 Простой Комментировать

Решения вопроса 1

6 комментариев

Vitaliy @Ni55aN Автор вопроса

что-то вроде состояний есть (не формально), например, как уже было указано в топике, игрок оббегает мяч, если тот катится в свои ворота.

Есть практические примеры?

Написано более трёх лет назад
xmoonlight @xmoonlight

дима кубитский, (ник - отличный! ))))
Никаких слева/справа - только градусы! )

Написано более трёх лет назад
⚡ Kotobotov ⚡ @angrySCV

Виталий Столяров, фитчи можешь прикручивать какие в голову взбредет (главно чтоб их можно было оценить) в качестве состояния - чем больше фитч, например расстояние до мяча, возможно какая-то позиция противника, тем сложнее может получится поведение бота, тем дольше и сложнее обучать агента.
следует помнить для полного перебора состояний и возможных реакций может не хватит жизни нашей вселенной, поэтому используются упрощения моделей и всякие методики типа генетических алгоритмов для поиска комбинаций, нейросети используются для быстрой гибкой подгонки параметров в моделях.
сами параметры (фитчти и действия), обычно ищутся с помощью других методик.

Написано более трёх лет назад
⚡ Kotobotov ⚡ @angrySCV

xmoonlight, хех ты для начала задачу с бинарными признаками реши, а потом уже переходи к подгонке параметров (градусов, расстояний))))
у него статистики нету ни по каким положениям и не откуда эту статистику брать. Ему нужно тогда либо моделировать в ручную, либо писать самообучающихся агентов.
модель с углами можно описать также в нескольких дискретных состояний (поворотов например на 30 градусов), чего будет вполне достаточно для качественного решения.

Написано более трёх лет назад
xmoonlight @xmoonlight

дима кубитский, ну по бинарным признакам - как раз всё просто: "все бусинки на нитке" или нет) (где нитка - это цепь из событий, необходимых для успешности "хода")
А вот что нет статистики - это не проблема. Главное - создать агента.

Написано более трёх лет назад
⚡ Kotobotov ⚡ @angrySCV

Виталий Столяров, вот хороший курс, с примерами.
https://www.youtube.com/channel/UCDZUttQj8ytfASQIc...

Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Нейронные сети

+2 ещё

Средний
Существует ли аналог GPTs?
- 2 подписчика
- 6 часов назад
- 105 просмотров
3

ответа
Python

+3 ещё

Простой
Можно ли сменить аватарку бота telegram без botfather?
- 2 подписчика
- 12 часов назад
- 163 просмотра
2

ответа
Нейронные сети

+1 ещё

Простой
Какие сейчас текстовые нейросети можно локально поставить?
- 1 подписчик
- вчера
- 39 просмотров
1

ответ
Telegram

+1 ещё

Средний
Телеграм боты и пользователи?
- 1 подписчик
- вчера
- 106 просмотров
1

ответ
Python

+2 ещё

Простой
Почему не работает callback в Телеграм боте?
- 1 подписчик
- 15 апр.
- 83 просмотра
0

ответов
Python

+4 ещё

Простой
Как проверить наличие id в строке файла .txt на python?
- 1 подписчик
- 11 апр.
- 81 просмотр
0

ответов
Машинное обучение

+2 ещё

Простой
Создание нейронной сети для определения сортов яблок. Как осуществить?
- 1 подписчик
- 11 апр.
- 65 просмотров
0

ответов
PHP

+2 ещё

Простой
Как найти ошибку в телеграм боте?
- 1 подписчик
- 10 апр.
- 112 просмотров
1

ответ
Python

+3 ещё

Простой
Как и где захостить телеграм бота с БД на PostgreSQL?
- 1 подписчик
- 10 апр.
- 115 просмотров
1

ответ
Боты

+1 ещё

Средний
Timeout работает не так как надо, disnake py, что я делаю не так?
- 1 подписчик
- 10 апр.
- 16 просмотров
1

ответ
Показать ещё Загружается…

Программист SQL

САМО-Софт • Москва

До 220 000 ₽

Devops (Персона)

Сбер • Москва

от 230 000 ₽

Fullstack developer (JS, C++)

Сбер • Москва

от 300 000 ₽

Менеджер по продажам в онлайн-школу

17 апр. 2024, в 00:48

35000 руб./за проект

Сделать картинки для слов

17 апр. 2024, в 00:13

800 руб./за проект

Разработка backend python+django

17 апр. 2024, в 00:06

240000 руб./за проект

Answer 1 · 2017-10-14 13:14:12

вы должны понимать зачем вам нужно использовать именно нейронную сеть.
Вам лучше с самых азов зайти, кого обучать, как обучать и тд.
например упростить задачу до обучения "футболиста" в качестве "автономного агента", на основе конечного автомата, у которого есть состояние (окружения и его самого) и есть действия - и вы пробуете разные комбинации этих состояний и действий.
Например вы можете описать состояние футболиста как расположение мяча (справа слева впереди, впереди-справа, впереди слева и тд) - сопоставляешь этому состоянию отдельноое действие (движение вправо, влево и тд), дополнительно можешь сопоставить например расстояние до мяча.
например мяч вверху-слева дистанция 10 ячеек -> действие агента -> движения прямо
мяч справа слева дистанция 2 ячееки -> действие агента -> движение влево.
в итоге у тебя получается записанные сопоставления состояниям и действиям.

для того чтоб обучать оптимальному поведению тебе нужно вводить функцию оценки результата после действий, награждать (запоминать), действия которые приводят к увеличению результата, и отказываться от действий которые снижают результат.
результатом может быть например 1/"расстояния до меча"
в начале запускаешь агента с рандомными переборами взаимодействий между состояниями и действиями. Потом более менее обученных двигаться, запускаешь играть друг против друга например в футбол и тд.
добавляешь к результату оценку результата матча и тд.
можно использовать генетический алгоритм для более быстрого поиска оптимальных параметров конечного автомата, можешь попробовать потом нейросеть прикрутить. Можешь на основе статистики готовой какие-то выводы сделать (но у тебя статистики я так понимаю никакой нет, так что тебе все равно прийдется обучать бота, играя друг против друга, и перебирать случайные варианты).

С чего начать обучение бота на нейронной сети?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт