Tag: pandas

Применение нескольких функций к нескольким столбцам группы

В документах показано, как применять одновременно несколько объектов по объекту groupby с помощью dict с именами столбцов вывода в качестве ключей: In [563]: grouped['D'].agg({'result1' : np.sum, …..: 'result2' : np.mean}) …..: Out[563]: result2 result1 A bar -0.579846 -1.739537 foo -0.280588 -1.402938 Однако это работает только на объекте Series groupby. И когда dict аналогично передается группе […]

Панды: Назначенные задания

Я читал эту ссылку в разделе «Возвращение вида к копии». На самом деле я не понимаю, как работает концепция .ix() назначений в Pandas и как влияет на нее использование .ix() , .iloc() или .loc() . Я получаю предупреждения SettingWithCopyWarning для следующих строк кодов, где data являются фреймворком Panda, а amount – это имя столбца (серии) […]

Есть ли способ (довольно) распечатать всю Pandas Series / DataFrame?

Я много работаю с Series и DataFrames на терминале. По умолчанию __repr__ для серии возвращает восстановленный образец с некоторыми значениями головы и хвоста, но остальные отсутствуют. Есть ли встроенный способ печати всей серии / DataFrame? В идеале, это будет поддерживать правильное выравнивание, возможно, границы между столбцами и, возможно, даже цветовое кодирование для разных столбцов.

pandas объединяет несколько кадров данных в столбцах

У меня есть 3 файла CSV. Каждый из них имеет первый столбец в качестве (строковых) имен людей, а все остальные столбцы в каждом фрейме данных являются атрибутами этого человека. Как я могу «объединить» все три CSV-документа для создания единого CSV с каждой строкой, имеющей все атрибуты для каждого уникального значения имени строки лица? Функция join() […]

Разбитые участки в Pandas / Pyplot: как построить по категориям

Я пытаюсь сделать простой график рассеяния в pyplot, используя объект Pandas DataFrame, но хочу иметь эффективный способ построения двух переменных, но иметь символы, продиктованные третьим столбцом (ключом). Я пробовал различные способы, используя df.groupby, но не успешно. Ниже приведен пример сценария df. Это окрашивает маркеры в соответствии с «ключ1», но Id любит видеть легенду с категориями […]

Loc против iloc против ix против vs. iat?

Недавно начал разворачиваться из моего безопасного места (R) в Python, и я немного смущен локализацией / выбором ячеек в Pandas . Я прочитал документацию, но я изо всех сил пытаюсь понять практические последствия различных вариантов локализации / выбора. Есть ли причина, по которой я должен когда-либо использовать .loc или .iloc по наиболее общему варианту .ix […]

Pandas: своеобразное падение производительности для inplace rename после dropna

Я сообщил об этом как о проблеме панд . Тем временем я публикую это здесь, надеясь спасти других, если они столкнутся с подобными проблемами. После профилирования процесса, который необходимо было оптимизировать, я обнаружил, что переименование столбцов NOT inplace повышает производительность (время выполнения) на x120. Профилирование указывает, что это связано с сбором мусора (см. Ниже). Кроме […]

vlookup в Pandas, используя соединение

У меня есть следующие 2 кадра данных Example1 sku loc flag 122 61 True 123 61 True 113 62 True 122 62 True 123 62 False 122 63 False 301 63 True Example2 sku dept 113 a 122 b 123 b 301 c Я хочу выполнить слияние или присоединить операцию, используя Pandas (или какой бы […]

Pandas: как использовать функцию apply для нескольких столбцов

У меня есть некоторые проблемы с функцией применения Pandas при использовании нескольких столбцов со следующим фреймворком данных df = DataFrame ({'a' : np.random.randn(6), 'b' : ['foo', 'bar'] * 3, 'c' : np.random.randn(6)}) и следующая функция def my_test(a, b): return a % b Когда я пытаюсь применить эту функцию, выполните следующие действия: df['Value'] = df.apply(lambda row: […]

Объедините два столбца текста в dataframe в pandas / python

У меня есть 20 x 4000 фрейм данных в python с использованием pandas. Две из этих столбцов называются Год и квартал. Я хотел бы создать переменную, называемую периодом, которая делает Year = 2000 и quarter = q2 в 2000q2 Может ли кто-нибудь помочь с этим?

Python - лучший язык программирования в мире.