@ModestesGonze

Как правильно подготовить данные для обучения сети?

Привет.

Есть исходные данные в таком виде. (одна строка из набора)
Ford, Mustang, 25000, 0, 0, 6, Автоматическая, 2013, Задний, Бензин, 3.7 л, 10, 4, Спорткары, Купе, 87, 568

Последний столбец [568] это метка(объект), сама цифра это кол-во просмотров в сутки, все остальные столбцы это признаки.
После обучения сети, для прогноза, на вход будут подоваться все данные кроме последнего столбца. В итоге сеть должна предсказать число из последнего столбца. Далее уже по результатам будет происходить ранжирование выдачи.

Вопросы:
1. Как правильно подготовить данные перед подачей в сеть? Текстовые (я так понял это категориальные) данные нужно конвертировать в числа, но какие методы для этого использовать?

2. Какая модель подойдет для это задачи? Я так полагаю что линейная регрессия, но не уверен.

3. Как на выходе получать не 0 - 1 а число в том же виде что и в исходных данных? Тут я так понимаю можно как то обратно конвертировать метку(результат).

4. Какую библиотеку посоветуете для этой задачи? Сеть простая, думал использовать Tensorflow, пока вникал в тему понял что есть много других библиотек, например Keras и Scikit-learn.

В питоне разбираюсь плохо, не говоря уже об ML, но тема жутко интересна, ковыряю потихоньку. В голове много пробелов которые не понятно как заполнить. Демки делаю, но нет уверености, что делаю правильно.

UPD:
И еще. В данных с 3 по 5 колонки это тарифы [25000, 0, 0], в приведеном примере последние два тарифа не указаны, поэтому в них прописан 0. У других автомобилей есть все три тарифа или только два.
Для сети лучше оставить как есть, по нулям, или лучше там где один например дублировать его, а там где два, дублировать максимальный?
  • Вопрос задан
  • 77 просмотров
Пригласить эксперта
Ответы на вопрос 1
DanilBaibak
@DanilBaibak
Machine Learning engineer
Для подготовки данных, sklearn - отличный выбор. В библиотеке имеется ряд инструментов для препроцессинга. Еще немного примеров можно посмотреть здесь.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы