4 Однострочника с пандами, которые эффективно решают конкретные задачи
4 Однострочника с пандами эффективное решение конкретных задач
Сложные задачи, решаемые быстро и просто
![Фото от Tom Bradley on Unsplash](https://ai.miximages.com/miro.medium.com/v2/resize:fit:640/format:webp/1*ABF9_0Jp2IZ0Epl-D_rKiA.jpeg)
Сторонние библиотеки создаются и развиваются в ответ на потребности. Никто не садится и не говорит: “Я создам инструмент и подожду, пока возникнут обстоятельства, в которых другим потребуется он”. Вместо этого они опознают проблему и думают о решении, которое поможет ее решить. Именно так появляются инструменты.
То же самое относится к добавлению новых функций в существующие инструменты. Насколько хорошо и быстро добавляются новые функции зависит от популярности инструмента и команды, стоящей за ним.
Пандас, конечно же, имеет очень активное сообщество, которое делает Пандас одной из самых популярных библиотек для анализа данных и очистки данных в экосистеме науки о данных.
У Пандас есть функции для решения очень специфических проблем и использования. Их, вероятно, требовали от сообщества, которое активно использует инструмент.
- Птичий взгляд на линейную алгебру почему умножение матриц такое?
- Причинно-следственная диаграмма преодоление Ахиллесова пяточного сухожилия в наблюдательных данных
- Повышение связанности Ренессанс вычислений на краю в Интернете вещей.
В этой статье я поделюсь 4 операциями, которые вы можете выполнить в одной строке кода с помощью Пандас. Они помогли мне эффективно решать определенные задачи и приятно удивили.
1. Создание словаря из списка
У меня есть список элементов, и я хочу увидеть их распределение. Более конкретно, я хочу увидеть уникальные значения вместе с их числом вхождений в список.
Словарь Python – отличный способ хранить данные в этом формате. Элементы будут ключами словаря, а количество вхождений – значениями.
Благодаря функциям value_counts
и to_dict
, эту задачу можно выполнить в одной строке кода.
Вот простой пример, демонстрирующий этот случай:
import pandas as pd
grades = ["A", "A", "B", "B", "A", "C", "A", "B", "C", "A"]
pd.Series(grades).value_counts().to_dict()
# вывод
{'A': 5, 'B': 3, 'C': 2}
Сначала мы преобразуем список в Pandas Series, который является одномерной структурой данных Pandas. Затем мы применяем функцию value_counts
, чтобы получить уникальные значения с их частотой в серии. Наконец, мы преобразуем вывод в словарь.