Как правильно задать обучающую выборку для нейронной сети?

Question

ivodopyanov @ivodopyanov

NLP, python, numpy, tensorflow

Как правильно задать обучающую выборку для нейронной сети?

К примеру, есть такой набор данных для supervised learning, задача классификации:
Входные данные - это 20 дискретных параметров в диапазоне от 1 до 200. Каждое значение - это некоторый класс. Номера классов никак не связаны, т.е. отношения больше\меньше между ними нет, так что номера по сути ничего не значат. Сами параметры равноправные, разницы между первым и вторым тоже нет.
Выходные данные - это номер одного из этих 20 параметров, которые надо выбрать.
Аналогия - есть несколько игральных карт различного достоинства, и надо выбрать одну из них.

Входные данные
1) Могут быть непосредственно 20 значений в диапазоне 1-200.
2) Или это может быть разбиение по количеству классов среди входных переменных - т.е. это будет 200 параметров в диапазоне 1-20. Большинство из них будут равны 0, некоторые - 1, с очень небольшой вероятностью - 2 и более. Но тогда связей в сети получается куда больше.

И по выходным данным -
1) Это может быть 200 значений, номер выбранного класса. Но такое представление допускает нейронной сети сделать выбор класса, который не представлен во входных значениях.
2) Номер выбранного параметра. Но тогда перестановка входных значений может легко привести к иному результату, наверное.

Как же правильно представить такие данные?

Вопрос задан более трёх лет назад
2889 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Нейронные сети

Простой
Что такое A2A_II_EXCH?
- 1 подписчик
- 21 апр.
- 19 просмотров
0

ответов
Нейронные сети

Простой
Какие нейросети имеют доступ к страницам сайте в интернете?
- 1 подписчик
- 20 апр.
- 58 просмотров
1

ответ
Аудио

+2 ещё

Простой
Какой программой можно сделать из текста рэп?
- 1 подписчик
- 20 апр.
- 674 просмотра
2

ответа
IT-образование

+3 ещё

Простой
Какая есть литература полезная и понятная по Data Science на русском?
- 3 подписчика
- 17 апр.
- 1025 просмотров
1

ответ
Нейронные сети

+1 ещё

Средний
Существует ли аналог GPTs?
- 3 подписчика
- 16 апр.
- 1062 просмотра
3

ответа
Нейронные сети

+1 ещё

Простой
Какие сейчас текстовые нейросети можно локально поставить?
- 1 подписчик
- 16 апр.
- 85 просмотров
1

ответ
Машинное обучение

+2 ещё

Простой
Создание нейронной сети для определения сортов яблок. Как осуществить?
- 1 подписчик
- 11 апр.
- 96 просмотров
0

ответов
Python

+2 ещё

Средний
Как преобразовать эмбеддинг текста в понятный сверточным слоям?
- 2 подписчика
- 05 апр.
- 73 просмотра
1

ответ
Машинное обучение

+1 ещё

Средний
Как работает адаптивный бустинг для регрессии?
- 1 подписчик
- 05 апр.
- 24 просмотра
0

ответов
Машинное обучение

+1 ещё

Средний
Чем отличается стекинг от блендинга?
- 1 подписчик
- 02 апр.
- 48 просмотров
1

ответ
Показать ещё Загружается…

Data Scientist (Финтех)

Intelinvest

от 60 000 ₽

Senior ML Engineer (Computer Vision)

Gradient

от 450 000 ₽

Python/Django-разработчик (mobile+AI)

4Taps AI • Тольятти

от 150 000 до 250 000 ₽

Модель управления электродвигателем в Matlab, Simulink

24 апр. 2024, в 06:52

5000 руб./за проект

Анимация логотипа

24 апр. 2024, в 00:08

20000 руб./за проект

Разработка дизайна раздела «Статьи» на сайте «Мир отходов»

23 апр. 2024, в 23:01

10000 руб./за проект

Answer 1 · 2015-07-12 20:21:29

Признаки (фичи) данных нужно представлять правильно. Математика сетей такова, что если Вы представляете признак числом, то наблюдения со значениями признака 5 и 4 будут "ближе", чем, например, 5 и 100. Но если признак — это идентификатор группы (т.н. категориальный признак) пользователя, то их числовая близость ничего не значит.

Аналогично с выходом. Если предсказывать одно число, то это эквивалентно предположению, что предсказать 21 вместо 20 не так страшно, как выдать 1000. Опять же, для категориальных признаков это неправда.

Итого, если вход состоит из 20 категориальных признаков, то каждый признак нужно заменить на множество новых, получаемых one-hot-кодированием (так же известным как dummy variables): для каждого значения такого признака создаётся новый признак-индикатор, равный 1 только если соответствующий признак данного наблюдения равен соответствующему значению.

Аналогично с выходом.

Answer 2 · 2015-07-12 17:08:32

Тренировка НС - это из разряда искусства. Результат может быть лучшим при разных представлениях как входа, так и выхода.

Экспериментируйте.

Answer 3 · 2015-07-13 15:44:46

Что-то намудрено с кодированием значений. Почитайте Применение нейронных сетей для задач классификации
и 2.2 Постановка задач с категориальными признаками
Да и, в целом, поищите на тему "Методы кодирования информации", про количественные и качественные признаки.

Как правильно задать обучающую выборку для нейронной сети?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт