Панды Работайте с вашими dtypes!

Исправьте свои dtypes, чтобы избежать проблем с Пандами!

Правильные типы данных в pandas необходимы для чистого анализа данных. Вот как и почему.

Иметь подходящие типы данных для вашей Series и DataFrame очень важно по нескольким причинам:

  • Управление памятью: использование правильного dtype для конкретного столбца может значительно снизить использование памяти, и это также относится к DataFrame
  • Интерпретация: кто-либо другой (человек или компьютер) будет делать предположения о ваших данных на основе их dtype: если столбец с целыми числами хранится как строка, они будут обрабатывать его как строки, а не как целые числа
  • Это заставляет вас иметь чистые данные, такие как работа с отсутствующими значениями или ошибочно записанными значениями. Это значительно упростит анализ данных в дальнейшем

И вероятно есть еще много других причин. Можете назвать несколько? Если да, то напишите это в комментарии.

В этой первой статье моей серии о pandas, я хочу рассмотреть основы типов данных pandas — или dtypes.

Фото Chris Curry на Unsplash

Сначала мы рассмотрим доступные dtypes, которые предлагает pandas, а затем я сосредоточусь на 4 полезных dtypes, которые удовлетворят 95% ваших потребностей, а именно числовые dtypes, логический тип (boolean), строковый тип и категориальные dtypes.

Цель этой первой статьи – сделать вас более комфортными с различными типами данных, доступными в pandas, и обозначить их различия.

Если вас интересует pandas и временные ряды, обязательно ознакомьтесь с моими статьями о Фурье-преобразовании временных рядов:

  • Посмотрите, как свертка связана с Фурье-преобразованием и насколько она быстрая:

Фурье-преобразование для временных рядов: быстрая свертка, объясненная с помощью numpy

Свертка в 10000 раз быстрее с использованием Фурье-преобразования

towardsdatascience.com

  • Углубите свое понимание свертки с помощью примеров изображений:

Фурье-преобразование для временных рядов: о свертке изображений и SciPy

Фурье-преобразование свертки также применяется к изображениям

towardsdatascience.com

  • Поймите, как Фурье-преобразование может быть визуализировано