@onMymind

Какую посоветуете литературу (русскоязычную), по которой можно изучать data science?

Хотелось бы узнать про литературу-желательно русскоязычную- , по которой можно изучать data science(если она есть). DS хочется обхватить в приличном объёме, так что книги должны быть информативны и полны( их может быть вообще куча).

Спасибо большое.
  • Вопрос задан
  • 2817 просмотров
Пригласить эксперта
Ответы на вопрос 4
  • @azsx
    Выскажу непопулярное мнение. Сперва обязательно убедитесь, что вы знакомы с основами статистики и теории вероятностей на уровне решения бытовых задач. Можно не лезть в дебри, но задачи из реальной жизни стоит щёлкать как орешки. Затем убедитесь, что вы знаете sql или nosql (если вам непременно big data подавай). И будет совсем великолепно, если вы сможете понимать как хранятся данные на компьютере, (например, почему символ utf8 может быть 1 или 4 байта).
    Потом да, можно книжки читать. Их прекрасно применять на практике, но негде в РФ.
    Ответ написан
  • @red-barbarian
    По машинному обучению:
    Теория - Петер Флах Машинное обучение.
    Практика - Л. П. Коэльо, В. Ричард - Построение систем машинного обучения на языке Python.
    Много статей есть в инете.
    Ответ написан
  • Sergei_Erjemin
    @Sergei_Erjemin
    Улыбайся, будь самураем...
    Нужно изучать базис мат-анализа и высшей алгебры. Книжки содержат слишком много практики и микро-рецептов, которую легко наработать на реальных проектах. А вот теории а них мало. Приведу пример: Купил книжечку "Python и анализ данных". Не могу сказать, что сильно помогла, но кое в чем действительно полезна. Всякие составные индексы, обработка Excel-файлов, визуализация, манимуляции с массивами... Но вот почему в одном случае надо брать один метод, а другом иной. или где нужно отбрасывать крайние значения а где нет -- загадка.

    Позже случайно попался краудфандинговый проект "Статистика и Котики" и купил эту книжку. После прочтения появилось понимание приемлемости тех или иных методов анализа данных. Даже получается самому эти методики придумывать (какие характеристики объектов анализа и как измерять, где применять систему весов и балов...). Бумажную книжку, полагаю, уже не купить. А вот электронную можно найти. Очень рекомендую.

    P.S. Есть еще один аспект в котором надо разбираться для успешного анализа данных. Так сказать, предметная область, понимание как получаются цифровые характеристики объектов анализа. Без этого, методики анализа приходится подбирать на ощупь и не всегда правильно. К сожалению, не всегда понимаешь как что измеряют. Например, при оцифровке характеристик текстов или изображений. Есть куча примеров в интернете, в них используют готовые библиотеки, которые выдают из текста или картинок матрицы и вектора... Дальше эти матрицы сворачивают и разворачивают, вектора перемножают и т.п. Но вот зачем и почему в таком порядке? Чтобы ко всему этому применять машинное обучение, ИМХО, очень полезно понимать как получают эти матрицы и вектора. Без этого ощущаешь себя обезьяной, которая знает какие надо сделать манипуляции, чтобы получить банан (найти похожие тексты или картинки), можно даже понимать как и почему банан движется по конвейеру к клетке, но откуда появляется банан не понимаешь. :)
    Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через TM ID
Похожие вопросы
Вакансии с Моего Круга Все вакансии
Заказы с Фрилансим Все заказы