Tag: pandas

как собрать столбец DataFrame в пары ключевых значений как строку в python

Я пытаюсь собрать столбец данных Pandas DataFrame в парах значений ключей, как список в python. Если мы возьмем этот DataFrame в качестве примера, я хочу перейти отсюда: import pandas as pd from collections import OrderedDict df = pd.DataFrame({'value_2016': [200], 'value_2017': [300], 'value_2018': [float('NaN')]}) print(df) value_2016 value_2017 value_2018 0 200 300 NaN чтобы: df_result = pd.DataFrame(OrderedDict({'year': […]

Вложенный словарь для MultiIndex pandas DataFrame (3 уровня)

Я хотел бы сделать эквивалент этого для 3-го уровня вложенного словаря Вложенный словарь в мультииндексный фреймворк, где словарные ключи – это метки столбцов

Смешанные типы элементов в столбце DataFrame

Рассмотрим следующие три DataFrame : df1 = pd.DataFrame([[1,2],[4,3]]) df2 = pd.DataFrame([[1,.2],[4,3]]) df3 = pd.DataFrame([[1,'a'],[4,3]]) Ниже приведены типы второго столбца DataFrame : In [56]: map(type,df1[1]) Out[56]: [numpy.int64, numpy.int64] In [57]: map(type,df2[1]) Out[57]: [numpy.float64, numpy.float64] In [58]: map(type,df3[1]) Out[58]: [str, int] В первом случае все int передаются в numpy.int64 . Хорошо. В третьем случае в основном нет […]

Панды: как рисовать планку с двумя категориями и по четыре серии?

У меня есть следующий dataframe, где pd.concat используется для группировки столбцов: ab C1 C2 C3 C4 C5 C6 C7 C8 0 15 37 17 10 8 11 19 86 1 39 84 11 5 5 13 9 11 2 10 20 30 51 74 62 56 58 3 88 2 1 3 9 6 0 […]

pandas plot time series

У меня есть следующий код, пытающийся построить временные ряды. Заметьте, я отбрасываю второй столбец, потому что это не имеет значения. И я бросаю первую и последнюю строки. import pandas as pd activity = pd.read_csv('activity.csv', index_col=2) activity = activity.ix[1:-1] #drop first and last rows due to invalid data series = activity['activity'] series.plot() Я получаю следующую ошибку: […]

Может pandas groupby преобразовать DataFrame в серию?

Я хотел бы использовать pandas и statsmodels, чтобы соответствовать линейной модели на подмножествах кадра данных и возвращать предсказанные значения. Тем не менее, мне трудно понять правильную идиому панд. Вот что я пытаюсь сделать: import pandas as pd import statsmodels.formula.api as sm import seaborn as sns tips = sns.load_dataset("tips") def fit_predict(df): m = sm.ols("tip ~ total_bill", […]

Запись GeoDataFrame в базу данных SQL

Надеюсь, что мой вопрос не смешон, так как, на удивление, этот вопрос, по-видимому, пока еще не был задан (насколько мне известно) на популярных веб-сайтах. Ситуация в том, что у меня есть несколько файлов csv, содержащих в общей сложности более 1 Mio-наблюдений. Каждое наблюдение содержит, в частности, почтовый адрес. Я планирую читать все файлы в один […]

Как получить случайный (бутстрап) образец из pandas multiindex

Я пытаюсь создать загрузочный образец из мультииндекса данных в Pandas. Ниже приведен код для генерации данных, которые мне нужны. from itertools import product import pandas as pd import numpy as np df = pd.DataFrame({'group1': [1, 1, 1, 2, 2, 3], 'group2': [13, 18, 20, 77, 109, 123], 'value1': [1.1, 2, 3, 4, 5, 6], 'value2': […]

Как сделать участок мозаики в Matplotlib

Я знаю, что вы можете использовать мозаичный сюжет из statsmodels, но это немного расстраивает, когда ваши категории имеют некоторые пустые значения ( например, здесь ). Мне было интересно, существует ли решение с графической библиотекой, такой как matplotlib или seaborn, что было бы более удобно. Я думаю, что это была бы приятная особенность для морского обихода, […]

Удалить границу из таблицы html, созданной через pandas

Я использую скрипт python для отображения данных на веб-странице. Я использовал df.to_html для преобразования моего фрейма данных в HTML. Однако по умолчанию он устанавливает границу в 0. Я попытался переопределить ее, создав собственный шаблон css, но он не сработал. Вот мой код панды: ricSubscription.to_html(classes='mf') Есть ли параметр, который я могу передать, чтобы установить границу до […]

Python - лучший язык программирования в мире.