Tag: pandas

Pandas: своеобразное падение производительности для inplace rename после dropna

Я сообщил об этом как о проблеме панд . Тем временем я публикую это здесь, надеясь спасти других, если они столкнутся с подобными проблемами. После профилирования процесса, который необходимо было оптимизировать, я обнаружил, что переименование столбцов NOT inplace повышает производительность (время выполнения) на x120. Профилирование указывает, что это связано с сбором мусора (см. Ниже). Кроме […]

vlookup в Pandas, используя соединение

У меня есть следующие 2 кадра данных Example1 sku loc flag 122 61 True 123 61 True 113 62 True 122 62 True 123 62 False 122 63 False 301 63 True Example2 sku dept 113 a 122 b 123 b 301 c Я хочу выполнить слияние или присоединить операцию, используя Pandas (или какой бы […]

Pandas: как использовать функцию apply для нескольких столбцов

У меня есть некоторые проблемы с функцией применения Pandas при использовании нескольких столбцов со следующим фреймворком данных df = DataFrame ({'a' : np.random.randn(6), 'b' : ['foo', 'bar'] * 3, 'c' : np.random.randn(6)}) и следующая функция def my_test(a, b): return a % b Когда я пытаюсь применить эту функцию, выполните следующие действия: df['Value'] = df.apply(lambda row: […]

Объедините два столбца текста в dataframe в pandas / python

У меня есть 20 x 4000 фрейм данных в python с использованием pandas. Две из этих столбцов называются Год и квартал. Я хотел бы создать переменную, называемую периодом, которая делает Year = 2000 и quarter = q2 в 2000q2 Может ли кто-нибудь помочь с этим?

python pandas: применить функцию с аргументами к ряду

Я хочу применить функцию с аргументами к серии в python pandas: x = my_series.apply(my_function, more_arguments_1) y = my_series.apply(my_function, more_arguments_2) … В документации описывается поддержка метода apply, но он не принимает никаких аргументов. Есть ли другой метод, который принимает аргументы? В качестве альтернативы, я пропустил простой обходной путь?

Значения Remap в столбце pandas с dict

У меня есть словарь, который выглядит так: di = {1: "A", 2: "B"} Я хотел бы применить его к столбцу «col1» в кадре данных, подобном: col1 col2 0 wa 1 1 2 2 2 NaN получить: col1 col2 0 wa 1 A 2 2 B NaN Как я могу это сделать? По какой-то причине условия, […]

Как применить функцию к двум столбцам кадра данных Pandas

Предположим, что у меня есть df который имеет столбцы 'ID', 'col_1', 'col_2' . И я определяю функцию: f = lambda x, y : my_function_expression . Теперь я хочу применить f к двум столбцам df « 'col_1', 'col_2' чтобы по элементам вычислить новый столбец 'col_3' , несколько похожий: df['col_3'] = df[['col_1','col_2']].apply(f) # Pandas gives : TypeError: […]

pandas + dataframe – выбор по частичной строке

У меня есть DataFrame с 4 столбцами, из которых 2 содержат строковые значения. Мне было интересно, есть ли способ выбора строк на основе частичного совпадения строк с конкретным столбцом? Другими словами, функция или лямбда-функция, которая будет делать что-то вроде re.search(pattern, cell_in_question) возвращая логическое значение. Я знаком с синтаксисом df[df['A'] == "hello world"] но, похоже, не […]

группировка строк в списке в pandas groupby

У меня есть кадр данных pandas, например: A 1 A 2 B 5 B 5 B 4 C 6 Я хочу сгруппировать по первому столбцу и получить второй столбец в виде списков в строках: A [1,2] B [5,5,4] C [6] Можно ли сделать что-то подобное, используя pandas groupby?

Pandas DataFrame: удалить ненужные части из строк в столбце

Я ищу эффективный способ удаления ненужных деталей из строк в столбце DataFrame. Данные выглядят так: time result 1 09:00 +52A 2 10:00 +62B 3 11:00 +44a 4 12:00 +30b 5 13:00 -110a Мне нужно обрезать эти данные, чтобы: time result 1 09:00 52 2 10:00 62 3 11:00 44 4 12:00 30 5 13:00 110 […]

Python - лучший язык программирования в мире.