4 Однострочника с пандами, которые эффективно решают конкретные задачи

4 Однострочника с пандами эффективное решение конкретных задач

Сложные задачи, решаемые быстро и просто

Фото от Tom Bradley on Unsplash

Сторонние библиотеки создаются и развиваются в ответ на потребности. Никто не садится и не говорит: “Я создам инструмент и подожду, пока возникнут обстоятельства, в которых другим потребуется он”. Вместо этого они опознают проблему и думают о решении, которое поможет ее решить. Именно так появляются инструменты.

То же самое относится к добавлению новых функций в существующие инструменты. Насколько хорошо и быстро добавляются новые функции зависит от популярности инструмента и команды, стоящей за ним.

Пандас, конечно же, имеет очень активное сообщество, которое делает Пандас одной из самых популярных библиотек для анализа данных и очистки данных в экосистеме науки о данных.

У Пандас есть функции для решения очень специфических проблем и использования. Их, вероятно, требовали от сообщества, которое активно использует инструмент.

В этой статье я поделюсь 4 операциями, которые вы можете выполнить в одной строке кода с помощью Пандас. Они помогли мне эффективно решать определенные задачи и приятно удивили.

1. Создание словаря из списка

У меня есть список элементов, и я хочу увидеть их распределение. Более конкретно, я хочу увидеть уникальные значения вместе с их числом вхождений в список.

Словарь Python – отличный способ хранить данные в этом формате. Элементы будут ключами словаря, а количество вхождений – значениями.

Благодаря функциям value_counts и to_dict, эту задачу можно выполнить в одной строке кода.

Вот простой пример, демонстрирующий этот случай:

import pandas as pd
grades = ["A", "A", "B", "B", "A", "C", "A", "B", "C", "A"]
pd.Series(grades).value_counts().to_dict()
# вывод
{'A': 5, 'B': 3, 'C': 2}

Сначала мы преобразуем список в Pandas Series, который является одномерной структурой данных Pandas. Затем мы применяем функцию value_counts, чтобы получить уникальные значения с их частотой в серии. Наконец, мы преобразуем вывод в словарь.

2. Создание DataFrame из файла JSON