Tag: dataframe

Python – Pandas – DataFrame сокращает количество строк

У меня есть DataFrame: ind col1 col2 1 12 string1 … 2 23 string2 … 3 34 string1 … 4 13 string2 … 5 17 string3 … … … … … Я хочу свернуть DataFrame, чтобы col2 был уникальным. В col1 (и всех других числовых столбцах) я хочу поместить медиану всех значений, где col2 был […]

Как объединить несколько похожих .csv-файлов в один фрейм данных с заданной структурой

У меня много файлов .csv, которые похожи по структуре: 1.csv Type n A 1 B 20 C 34 D 5 … 2.csv Type n A 2 B 15 C 16 D 5 … Я хочу объединить их в нечто вроде: Type n1 n2 A 1 2 B 20 15 C 34 16 D 5 5 […]

PANDAS: Неправильная форма индексов прошла, не знаю, как это исправить

Я пытаюсь создать 7-й столбец в фрейме данных: arb_ser_num = 'zDfDD45' predefined_number = 878 DATE Q1 Q2 Q3 Q4 Q5 0 2012-08-20 00:00:00 [Atlantic, Z, dEdd] None None None None 1 2012-08-21 00:00:00 [Pacific, Y, dEdd] None None None None 2 2012-08-22 00:00:00 [Indian, Y, dRdd] None None None None 3 2012-08-23 00:00:00 [Meditar, Z, […]

Групповые данные на основе метки столбцов в кадре данных pandas

Я читал об иерархическом индексе и мультииндексе в кадре данных pandas, но, похоже, это все для упорядоченных ярлыков. Например, мои данные выглядят так: И я хочу иметь возможность группировать данные вместе на основе метки столбца, т.е. совокупность всех столбцов с «d» в строке 3 вместе путем усреднения. Каков наилучший способ получить данные Excel (или csv, […]

Pandas Dataframe – Установите ряды, равные другим строкам

Для этого базового фрейма я хотел бы установить строки, равные другим строкам. У меня нет проблем делать это по одной строке за раз: import pandas as pd import numpy как np df = pd.DataFrame (np.random.randn (10, 5)) df.loc [6 ,:] = df.loc [4 ,:] Однако, когда я пытаюсь сделать это для нескольких строк, они устанавливаются […]

Как создать фрейм данных pandas в python из csv с дополнительными разделителями?

У меня большой csv (порядка 400 тыс. Строк), который я хочу превратить в фрейм данных в python. Исходный файл имеет два столбца: текстовый столбец, за которым следует столбец int (или NAN). Пример: … P-X1-6030-07-A01 368963 P-X1-6030-08-A01 368964 P-X1-6030-09-A01 368965 PA-1-1011-14-G-01 368967 PA-1-1014-01-G-05 368968 PA-1-1017-02-D-01 368969 … Я хотел бы дополнительно разделить текстовый столбец на ряд […]

простая сводная таблица базы данных pandas

Я пытаюсь сделать кажущуюся очень простую задачу. С учетом данных: daf = pd.DataFrame ({'co': ['g', 'r', 'b', 'r', 'g', 'r', 'b', 'g'], 'sh': [ 'с', 's', 'R', 'R', 'R', 's', 'с', 'г']}) co sh 0 gc 1 rs 2 br 3 rr 4 gr 5 rs 6 bc 7 gr Я хотел бы подсчитать количество […]

pandas: сортировать каждый столбец индивидуально

Мой dataframe выглядит примерно так, только намного больше. d = {'Col_1' : pd.Series(['A', 'B']), 'Col_2' : pd.Series(['B', 'A', 'C']), 'Col_3' : pd.Series(['B', 'A']), 'Col_4' : pd.Series(['C', 'A', 'B', 'D']), 'Col_5' : pd.Series(['A', 'C']),} df = pd.DataFrame(d) Col_1 Col_2 Col_3 Col_4 Col_5 ABBCA BAAAC NaN C NaN B NaN NaN NaN NaN D NaN Во-первых, я […]

pandas pivot_table multiple aggfunc

Когда я создаю сводную таблицу на фрейме данных, который у меня есть, передача aggfunc='mean' работает, как и ожидалось, aggfunc='count' работает так, как ожидалось, однако aggfunc=['mean', 'count'] приводит к: AttributeError: 'str' object has no attribute '__name__ Этот формат, казалось, работал ранее: несколько AggFun в Pandas Как создать сводную таблицу с несколькими функциями?

Создание столбцов и упорядочение в Pandas DataFrame

Я ищу элегантный, Pythonic способ сделать столбцы Pandas DataFrame согласованными. Имея в виду: Убедитесь, что все столбцы в основном списке присутствуют, и если не добавить в пустой столбец-заполнителя. Убедитесь, что столбцы находятся в том же порядке, что и основной список. У меня есть следующий пример, который работает, но есть ли встроенный метод Pandas для достижения […]

Python - лучший язык программирования в мире.