5 бесплатных книг для освоения науки о данных

5 бесплатных книг для освоения науки о данных и анализа информации

 

Когда вы начинаете изучать науку о данных, у вас есть огромное разнообразие ресурсов у вас под рукой, таких как курсы Udemy, видеоролики на YouTube и статьи. Но вам необходимо создать структуру того, что вы должны изучать, чтобы избежать чувства перегрузки и потери мотивации.

В этой статье будут рассмотрены пять книг, которые охватят основные концепции, которые вы должны изучить в пути науки о данных. Каждая из этих книг поможет вам изучить:

  • Python
  • Статистика
  • Линейная алгебра
  • Машинное обучение
  • Глубокое обучение

 

Ветреное путешествие в Python

 

Ссылка на книгу: Ветреное путешествие в Python

Если вам интересно начать изучать Python, не тратя слишком много времени, эта книга может для вас подойти. В ней очень кратко рассматриваются основные концепции Python. Вместе с книгой в 100 страниц, есть также репозиторий на GitHub с упражнениями.

В частности, вы быстро узнаете основные типы данных Python: целые числа, числа с плавающей запятой, строки, логические значения, списки, кортежи, словари и множества. В конце книги дается краткий обзор библиотек Python, таких как NumPy, Pandas, Matplotlib, Scipy.

В книге рассматриваются следующие темы:

  • Основный синтаксис
  • Переменные
  • Операторы
  • Основные типы данных
  • Цикл for
  • Цикл while
  • Функции
  • Конструкция if-elif-else
  • Краткий обзор библиотек Python

 

Мыслители: Вероятность и статистика для программистов

 

Ссылка на книгу: Мыслители: Вероятность и статистика

Бывает трудно приобрести хорошие знания вероятности и статистики, не применяя то, что вы изучаете на практике. Красота этой книги заключается в том, что она сосредоточена на нескольких основных концепциях и не только показывает теорию, но содержит также практические упражнения, написанные на Python.

Книга охватывает следующее:

  • Сводные статистики
  • Распределение данных
  • Вероятностные распределения
  • Теорема Байеса
  • Центральная предельная теорема
  • Проверка гипотез
  • Оценка

 

Введение в линейную алгебру для прикладного машинного обучения с использованием Python

 

Ссылка на книгу: Введение в линейную алгебру для прикладного машинного обучения

Когда вы изучаете линейную алгебру в университете, большую часть времени профессоры объясняют всю теорию без какого-либо практического применения. Поэтому, когда вы сдаете экзамен, вы забываете каждую концепцию, потому что в вашей голове она слишком абстрактна.

К счастью, я нашел эту удивительную книгу, которая представляет вам хорошее введение в основы линейной алгебры, с которыми вы столкнетесь, изучая модели машинного обучения. Каждая теоретическая концепция сопровождается практическим примером, написанным с использованием NumPy, известной библиотеки Python для научных вычислений.

Рассмотрены следующие основные темы:

  • Векторы
  • Матрицы
  • Проекции
  • Определитель
  • Собственные векторы и собственные значения
  • Сингулярное разложение

 

Введение в машинное обучение с использованием Python

 

Ссылка на книгу: Введение в машинное обучение с использованием Python

После изучения Python, статистики и линейной алгебры, настало время, наконец, узнать все о моделях машинного обучения для решения задач реального мира. Книга рекомендуется для начинающих и использует scikit-learn для применения методов машинного обучения.

Вот основные модели машинного обучения, объясненные:

  • Линейная регрессия
  • Наивный Байес
  • Деревья решений
  • Ансамбли деревьев решений
  • Метод опорных векторов
  • Анализ главных компонент
  • t-SNE
  • Кластеризация методом k-средних
  • DBSCAN

 

Глубокое обучение на языке Python

 

Ссылка на книгу: Глубокое обучение на языке Python

Эта пятая и последняя книга была создана для людей, которые уже имеют навыки программирования на Python и не имеют опыта работы в области машинного обучения. Автор этой книги – Франсуа Шолле, инженер-программист и исследователь искусственного интеллекта в Google, известный созданием библиотеки глубокого обучения Keras, выпущенной в 2015 году. Вот самые важные понятия:

  • Нейронные сети
  • Сверточные нейронные сети
  • Рекуррентные нейронные сети
  • LSTM
  • Генеративно-состязательные сети

 

Итоги

 

Эти предложения отлично подходят для новичков, которые хотят проникнуть в область науки о данных. Кроме того, они могут быть полезны для специалистов по обработке данных и исследователей, которые осознают свою недостаточную информированность по некоторым понятиям и нуждаются в укреплении своего понимания. Надеюсь, вам понравился этот список книг. Знаете ли вы другие полезные книги по науке о данных? Оставьте их в комментариях, если у вас есть ценные предложения.

[Евгения Анелло](https://www.linkedin.com/in/eugenia-anello/) в настоящее время является научным сотрудником в отделе информационной инженерии Университета Падуи, Италия. Ее исследовательский проект направлен на непрерывное обучение в сочетании с обнаружением аномалий.