globuzer
@globuzer
gezgrouvingus progreszive ombusgrander greyderzux

Как прокачаться и научиться языку программирования\аналитики R?

Как "прокачаться" и научиться языку программирования\аналитики R?
Какие темы выбрать, в какой последовательности, на что обратить внимание?
Что более перспективно из анализа данных в современных системах аналитики и что будет перспективно в будущем? Прогнозы?
Какие темы в математике подтянуть и наверстать для более эффективного использования с R?
Какие есть ресурсы, сайты, youtube-каналы, видеоуроки, вебинары по этой теме?
Конечно в первую очередь русскоязычные, но и английские тоже прокатят.
Как стать монстром bigdata-анализа с математическими скиллами и аналитической кармой, гуру R?
  • Вопрос задан
  • 9005 просмотров
Пригласить эксперта
Ответы на вопрос 7
Absolem
@Absolem
Я качаюсь на DataCamp на бесплатных курсах. Начинал с курса Try R от CodeSchool.com.
Дальше Специализация Data Science на coursera.org, можно всё проходить бесплатно.
Ответ написан
@volokhonsky
Не знаю, насколько уж я монстр вот этого всего, но расскажу, как у меня что-то получилось.
Сперва, лет пять, наверное, назад, я попробовал запустить R и что-то сделать, но у меня так и не получилось открыть файл. Года через полтора к нам на психфак СПбГУ приезжал один товарищ из какого-то американского вуза и собирался учить нас статистике, используемой в клинической психологии. Однако, большую часть занятия мы учились открывать файл в R, что очень помогло мне в дальнейшем.
В 2012 году я уже кое-что мог делать в R, но чувствовал себя крайне неуверенно и делал всё очень, очень медленно. После того, как я уволился из СПбГУ (всё-таки вести блог "Новости СПбГУ" было слишком рискованным предприятием) у меня уже не было академической лицензии на SPSS, и я полностью перешёл на R и занялся выполнением коммерческих заказов.
В одном из них мне надо было быстро подготовить штук пятнадцать отчётов по одинаковым геомаркетинговым исследованиям разных точек Подмосковья. И я нанял коллегу, который был в R прокачан куда больше меня. По моему заказу, он написал скрипт, который автоматически открывал все xls файлы в папке, обрабатывал их и складывал нарисованные в ggplot картинки в новые папочки.
В своей последующей работе я ещё около полутора лет пользовался фрагментами этого кода. Наконец, в июле 2014 года я устроился работать исследователем в компанию Wargaming, рассчитывая, что регулярная, ежедневная практика позволит мне существенно укрепить мои навыки. Всё-таки, работать постоянно - это не то же самое, что на 3-4 дня в месяц включаться в проект. И не прогадал в том плане, что мне больше не надо заглядывать в справочник по функциям, чтобы решать рядовые задачи.

Очень рекомендую в первую очередь заняться не освоением каких-то суперсложных модных методов обработки данных, а добиться полного и чёткого понимания команд "шейпинга" данных. Вот эти вот все aggregate, cast, melt, rbind.fill, apply, lapply, recode, merge... Потому что пока этого понимания нет, при работе с любыми другими методами 70-90% времени уходит на то, чтобы понять, как подготовить данные того вида, которые нужны.

Увы, решение устроиться на работу привело меня к полной невозможности повышать свою квалификацию на курсере и т.п., потому что времени на такое просто нет в принципе. Разве что если как-то так спланировать и отпуск или новогодние каникулы на сие потратить.
Ответ написан
Добавлю, там же на курсере есть пачка курсов по анализу данных:
https://www.coursera.org/jhu
Сам так начал программировать на R, еще можно взглянуть на udacity -- они очень не плохи, там же есть курс на pandas -- этакая смесь python и R.

В качестве практики можно начать писать статьи на хабр по этой теме. Все данные стараюсь собрать в одном и том же месте для всеобщего пользования: https://github.com/SergeyParamonov/HabraData

Народ на хабре такое воспринимает более менее положительно, там же можно получить фидбек (в виде комментов от знающих товарищей)
habrahabr.ru/company/dmlabs/blog/219679
habrahabr.ru/post/236759
habrahabr.ru/company/dmlabs/blog/218607
Ответ написан
@to_climb
Практические задачи можно порешать на сайтах типа Kaggle (есть аналоги на русском языке). Теория (как уже написали) на Coursera.
Ответ написан
@aksm
SEO analyst
Рекомендую взять в оборот блог r-analytics.blogspot.ru/.
Ребята недавно выпустили методичку по всему материалу блога: r-analytics.blogspot.ru/2014/12/r.html
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы