Zorohastres
@Zorohastres
Студент-экономист

С чего начать изучение Data mining самостоятельно?

Учусь в данный момент на экономиста и изучаю экономический анализ. Недавно заинтересовался таким направлением как Data mining, вопрос в том, что стоит перед тем как приступить к изучению самого Data mining, приступить к программированию или нужно что-то другое?
  • Вопрос задан
  • 2922 просмотра
Решения вопроса 1
@lPolar
data scientist
Data Mining область сложная, но интересная.
К классическому экономическому анализу (издержки, маржинальность) никакого отношения не имеет.
Data mining - это про анализ достаточно больших объемов данных с целью извлечь из них какую-либо ценную информацию.
ИМХО, DM разбивается на следующие куски:
1. Теория и алгоритмы
2. Программирование
3. Визуализация и анализ результатов
В первом куске лежит все, что относится к статистике, эконометрике, алгоритмам регрессии и классификации. Тут полезно знать тервер, эконометрику ( там все что линейное), алгоритмы классификации (там все что связано с методами ансамблей, нейронными сетями, SVM и т.д.)
В программировании заключается следующий стак задач:
1. Извлечение данных их разных источников (базы данных, json-файлы, парсинг сайтов, HDFS)
2. Преобразование данных (Data refinery, тут всякие группировки, трансформация данных, виды соединений)
3. Применение и программирование алгоритмов (тут нужно связать теорию алгоритмов с практикой).
4. Работа с BigData - тут все те же пункты, что и выше, но на других инструментах.
В последнем куске - визуализация - нужно научиться подавать полученные выводы в удобоваримом виде. Можно почитать Эдварда Тафти.
P.S. я тут списочек литературы по DM в порядке изучения:
Существуют ли заочные курсы или стажировка по анализу данных на русском языке?
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
bobrovskyserg
@bobrovskyserg
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы