Tag: pandas

Раскраски в пандах

Я могу импортировать данные из файла excel с помощью Pandas, используя: xl = read_excel('path_to_file.xls', 'Sheet1', index_col=None, na_values=['NA']) Теперь, когда у меня есть все данные в xl как DataFrame. Я хотел бы покрасить некоторые ячейки в эти данные на основе условий, определенных в другой функции, и экспортировать их (с цветовым кодированием) в файл Excel. Может ли […]

Как правильно поворачивать или изменять форму таймсеров в Pandas?

Мне нужно изменить форму данных, которая выглядит как df1 и превратить ее в df2. Для этой процедуры есть 2 соображения: Мне нужно установить количество строк, которые будут нарезаны как параметр (длина). Мне нужно разделить дату и время от индекса и использовать дату в изменении в качестве имен столбцов и сохранить время как индекс. Текущий df1 […]

Pandas groupby с dict

Можно ли использовать dict для группировки по элементам столбца? Например: In [3]: df = pd.DataFrame({'A' : ['one', 'one', 'two', 'three','two', 'two', 'one', 'three'], …: 'B' : np.random.randn(8)}) In [4]: df Out[4]: AB 0 one 0.751612 1 one 0.333008 2 two 0.395667 3 three 1.636125 4 two 0.916435 5 two 1.076679 6 one -0.992324 7 three […]

Условное замещение значений в столбцах dataframe pandas

предположим, что у меня есть фрейм данных pandas со значениями столбцов как возраст df.age = {25, 35, 76, 21, 23, 30} Я хочу сделать замену inplace следующим образом: если df.age> = 25 и df.age <= 35: замените это значение на 1 else: замените это значение на 0 Я пробовал этот df [df.age> = 7.35 и […]

Фильтр данных Pandas с другой серией

У меня есть серия Pandas, которую мы будем называть approved_fields, которую я бы хотел использовать для фильтрации df: approved_field(['Field1','Field2','Field3')] df Field 0 Field1 1 Field4 2 Field2 3 Field5 4 Field2 После применения фильтра authorized_field, полученный df должен выглядеть так: Field 0 Field1 1 Field2 2 Field2 Благодаря!

Pandas – Заменить выбросы с помощью группового

У меня есть рамка данных pandas, которую я хотел бы разбить на группы, вычислить среднее и стандартное отклонение, а затем заменить все выбросы на среднее значение группы. Выбросы определяются как таковые, если они больше трех стандартных отклонений от среднего значения группы. df = pandas.DataFrame({'a': ['A','A','A','B','B','B','B'], 'b': [1.1,1.2,1.1,3.3,3.4,3.3,100.0]}) Я думал, что следующее будет работать: df.groupby('a')['b'].transform(lambda x: […]

Добавить процент от общей колонки в Pandas pivot_table

Я не могу понять, как добавить% от общего столбца для каждой группы date_submitted в следующую сводную таблицу pandas: In [177]: pass_rate_pivot date_submitted audit_status 04-11-2014 audited 140 is_adserver 7 rejected 75 unauditable 257 04-18-2014 audited 177 is_adserver 10 pending 44 rejected 30 unauditable 226 04-25-2014 audited 97 is_adserver 5 pending 33 rejected 9 unauditable 355 Name: […]

Как эффективно пробовать комбинации строк в pandas DataFrame

Предположим, у меня есть панда DataFrame с определенным количеством столбцов и строк. Я хочу, чтобы найти комбинацию из 5 строк, которые в совокупности дают наивысший балл в конкретном столбце с некоторым пороговым значением. Ниже приведен пример небольшой игрушки, чтобы лучше проиллюстрировать его: Ниже приведен упрощенный пример моего кода, и мне интересно, является ли этот подход […]

python – сдерживается условными обозначениями pandas и / или булевым индексированием

У меня возникают проблемы с условными выражениями / булевыми индексами. Я пытаюсь заполнить dataframe (dfp) логикой, которая обусловлена ​​данными из аналогичной формы данных (dfs) плюс предыдущая строка сама по себе (dfp). Это моя последняя неудача … import pandas as pd dfs = pd.DataFrame({'a':[1,0,-1,0,1,0,0,-1,0,0],'b':[0,1,0,0,-1,0,1,0,-1,0]}) In [171]: dfs Out[171]: ab 0 1 0 1 0 1 2 […]

Длинные данные. Панды

Я пытаюсь взять мою фреймворк из длинного формата, в котором у меня есть столбец с категориальной переменной, в широкий формат, в котором каждая категория имеет свой собственный столбец цены. В настоящее время мои данные выглядят так: date-time date vendor payment_type price 03-10-15 10:00:00 03-10-15 A1 1 50 03-10-15 10:00:00 03-10-15 A1 2 60 03-10-15 10:00:00 […]

Interesting Posts
Python - лучший язык программирования в мире.