Tag: dataframe

значения подсчета pandas в каждом столбце кадра данных

Я смотрю, как найти способ подсчета количества значений в столбце, и это оказалось более сложным, чем я думал изначально. Percentile Percentile1 Percentile2 Percentile3 0 mediocre contender contender mediocre 69 mediocre bad mediocre mediocre 117 mediocre mediocre mediocre mediocre 144 mediocre none mediocre contender 171 mediocre mediocre contender mediocre Я пытаюсь создать что-то похожее на следующий […]

Создайте серию из Pandas DataFrame, выбрав элемент из разных столбцов в каждой строке

Моя цель – создать серию из Pandas DataFrame, выбирая элемент из разных столбцов в каждой строке. Например, у меня есть следующий DataFrame: In [171]: pred[:10] Out[171]: 0 1 2 Timestamp 2010-12-21 00:00:00 0 0 1 2010-12-20 00:00:00 1 1 1 2010-12-17 00:00:00 1 1 1 2010-12-16 00:00:00 0 0 1 2010-12-15 00:00:00 1 1 1 […]

PANDAS отбрасывает ряд строк из df

Я хочу удалить m количество строк из нижней части фрейма данных. Он индексируется целым числом (с отверстиями). Как это может быть сделано? pandas == 0.10.1 python == 2.7.3

Pandas: верхние N строк, верхние N строк на группу, эквивалентные для ROW_NUMBER OVER (PARTITION BY … ORDER BY …)

Что такое эквивалент python функции TOP в T-SQL? Я ищу, чтобы отфильтровать мою фреймворк в верхние 50K строк. Я посмотрел онлайн, и я не могу найти простой пример.

заменить значения столбцов в одном фрейме данных значениями другого блока данных

У меня есть два фрейма данных, первый из которых имеет 1000 строк и выглядит так: Date Group Family Bonus 2011-06-09 tri23_1 Laavin 456 2011-07-09 hsgç_T2 Grendy 679 2011-09-10 bbbj-1Y_jn Fantol 431 2011-11-02 hsgç_T2 Gondow 569 Группа столбцов имеет разные значения, иногда повторяющиеся, но в целом около 50 уникальных значений. Второй информационный кадр содержит все эти […]

Создание формулы, основанной на динамическом изменении столбцов для задания значений в столбце Data Data Frame Pandas

Я хочу создать столбец в кадре данных pandas, который является функцией списка переменных / динамических имен столбцов. Типичное создание столбцов: df['new']=(df['one']*x)+(df['two']*y)+(df['3']*z) где x, y, z – переменные из другого df. x 1.1 y 1.2 z 1.3 a 1.4 b 1.5 c 1.6 Я хочу создать столбец, который будет функцией списка переменных столбцов. Так, например, если: […]

Pandas фильтрует столбцы DataFrame с bool

Для DataFrame (df) с несколькими столбцами и строками ABCD 0 1 4 2 6 1 2 5 7 4 2 3 6 5 6 и другой DataFrame (dfBool), содержащий dtype: bool 0 True 1 False 2 False 3 True Каков самый простой способ разделить этот DataFrame на столбцы на два разных DataFrames путем переноса dfbool, […]

Почему isnt df = df_2 работает как ожидалось?

учитывая два DataFrames : #df1 value Symbol Date Type Value 1109914 AUD 2016-01-29 value 64587.9121 1109949 CAD 2016-01-29 value 65357.1429 1109970 CHF 2016-01-29 value 111881.8681 1110012 DX 2016-01-29 value 91256.4103 #df2 volas Symbol Date Type Value 1109915 AUD 2016-01-29 vola 518.5091 1109950 CAD 2016-01-29 vola 360.9474 1109971 CHF 2016-01-29 vola 767.1880 1110013 DX 2016-01-29 vola […]

Столбцы для строк в пандах

Я пытаюсь выполнить следующую операцию в pandas . Какие-нибудь предложения по pandas ? In [1]: input = pd.DataFrame({"X_1": [1], "X_2": [2], "X_3": [5], "Y_1": [1.2], "Y_2": [2.3], "Y_3": [3.4]}) In [2]: input Out[2]: X_1 X_2 X_3 Y_1 Y_2 Y_3 0 1 2 5 1.2 2.3 3.4 In [3]: output = pd.DataFrame({"X": [1,2,5], "Y": [1.2, 2.3, […]

Преобразование данных в базу данных pandas в список кортежей

У меня есть выборка данных следующим образом >>> df ab 0 1 2 1 3 4 Я хочу преобразовать это в список кортежей. Я попытался использовать itertuples() для того же >>> list(df.T.itertuples()) [('a', 1, 3), ('b', 2, 4)] Но я хочу, чтобы результат был в формате [('a', [1, 3]), ('b', [2, 4])], где первое значение […]

Python - лучший язык программирования в мире.