Tag: dataframe

Расширенные возможности Python pandas

Я думаю, что это похоже на этот пост, но не совсем то же самое, и я не могу обойти его. Итак, у меня в настоящее время есть (довольно странный) фрейм данных pandas со списками в каждой ячейке: >>> data = pd.DataFrame({'myid' : ['1', '2', '3'], 'num' : [['1', '2', '3'], ['1', '2'], []], 'text' : […]

Как отобразить конкретную цифру в кадре данных pandas

У меня есть dataframe, как показано ниже month 0 1 1 2 2 3 3 10 4 11 например, я хотел бы отобразить этот файл данных в 2-х цифрах, как это month 0 01 1 02 2 03 3 10 4 11 Я пробовал много методов, но не работал хорошо. Как я могу получить этот […]

Как эффективно регистрировать скорость изменения строк в Pandas DataFrame?

Предположим, у меня есть DataFrame ( в моем случае около 10000 строк, это всего лишь минимальный пример ) >>> import pandas as pd >>> sample_df = pd.DataFrame( {'col1': list(range(1, 10)), 'col2': list(range(10, 19))}) >>> sample_df col1 col2 0 1 10 1 2 11 2 3 12 3 4 13 4 5 14 5 6 15 […]

Переместить столбец для данных в панда данных

Я пытаюсь привести в порядок уже существующую базу данных панд. У меня есть файл csv, который я импортирую и выгляжу примерно следующим образом (это упрощенная версия): trial_num trial_name unit_1_act unit_2_act unit_3_act unit_4_act 0 face 0.0 0.000000 0.272244 0.006428 1 face 0.0 0.000000 0.898450 0.000000 2 face 0.0 0.893845 0.000000 0.000000 3 scene 0.0 0.879367 0.000000 […]

заполните dataframe двумя циклами и если условие в python

У меня два DataFrames, один выглядит примерно так: df1: xy Counts ab 1 ac 3 bc 2 cd 1 Второй – как индекс, так и столбцы – список уникальных значений в первых двух столбцах: df2 abcd a b c d То, что я хотел бы сделать, это заполнить второй DataFrame значениями из первого, учитывая, что […]

Возвратный кортеж индекса и значение .max ()?

Я пытаюсь вернуть кортеж индекса (имена людей ниже) и максимальное значение для столбца «%» ниже. Когда я создаю Dataframe и пытаюсь df['%'].max() Pandas всегда возвращает значение, а не индекс. Тем не менее, я хочу создать кортеж из пары значений ключа индекса и максимального значения в столбце «%». Я уверен, что это вопрос новичков, спасибо, что […]

удалить пример из dataframe pandas python

У меня есть dataframe, как это Phrase Sentiment [ good , movie ] positive [wooow ,is , it ,very, good ] positive [] negative [] pOSTIVE столбец Тип фразы – это объект и нужно удалить строки, содержащие [], и я не знаю, как это сделать, используя python как это: Phrase Sentiment [ good , movie […]

Панды: группировка и агрегация с несколькими функциями

ситуация У меня есть кадр данных pandas, который определяется следующим образом: import pandas as pd headers = ['Group', 'Element', 'Case', 'Score', 'Evaluation'] data = [ ['A', 1, 'x', 1.40, 0.59], ['A', 1, 'y', 9.19, 0.52], ['A', 2, 'x', 8.82, 0.80], ['A', 2, 'y', 7.18, 0.41], ['B', 1, 'x', 1.38, 0.22], ['B', 1, 'y', 7.14, 0.10], […]

Перевернутая суммарная сумма столбца в pandas.DataFrame

У меня есть pandas DataFrame с булевым столбцом, отсортированным по другому столбцу, и вам нужно рассчитать общую суммарную сумму, то есть количество истинных значений из текущей строки в нижнюю. пример In [13]: df = pd.DataFrame({'A': [True] * 3 + [False] * 5, 'B': np.random.rand(8) }) In [15]: df = df.sort_values('B') In [16]: df Out[16]: AB […]

Как подсчитать значения nan в pandas DataFrame?

Каков наилучший способ учета (не числа) значений nan в pandas DataFrame? Следующий код: import numpy as np import pandas as pd dfd = pd.DataFrame([1, np.nan, 3, 3, 3, np.nan], columns=['a']) dfv = dfd.a.value_counts().sort_index() print("nan: %d" % dfv[np.nan].sum()) print("1: %d" % dfv[1].sum()) print("3: %d" % dfv[3].sum()) print("total: %d" % dfv[:].sum()) Выходы: nan: 0 1: 1 3: […]

Python - лучший язык программирования в мире.