Tag: pandas

Серии с несколькими ключами в Pandas. Работа с промахами и дублирующими индексами

Кажется, есть три разных способа сделать несколько ключевых сечений в Pandas: Использование pd.IndexSlice Использование фильтра groupby Преобразование в панель, получение поперечного сечения и преобразование обратно в DataFrame Однако я не могу запускать решения, описанные в этих потоках. Позволь мне объяснить: Пример, который работает с idx : Скажем, я хочу получить поперечное сечение ['bar', 'flux'] связанное […]

Как выполнить повторную выборку данных внутрисетевого времени с помощью dateOffset в Pandas / Numpy?

Я имею дело с фьючерсами, где текущий день начинается до 00:00:00. Мне нужно сделать передискретизацию 1-минутных данных на 1 час данных с учетом смещения даты. Давайте посмотрим пример: df1 – данные 1 мин. Open High Low Close 2005-09-06 17:27:00 1234.75 1234.75 1234.75 1234.75 2005-09-06 17:28:00 1234.75 1234.75 1234.75 1234.75 2005-09-06 17:29:00 1234.75 1234.75 1234.75 1234.75 […]

Невозможно «установить установку numpy» на OS X Yosemite

Я не могу выполнить pip install pandas или pip install numpy после обновления до OS X Yosemite. Обе команды отлично работали раньше. Когда я бегу $ pip install numpy процесс компиляции работает около 30 секунд, а затем я получаю следующее: компиляция источников C C compiler: cc -DNDEBUG -g -fwrapv -Os -Wall -Wstrict-prototypes -Qunused-arguments -Qunused-arguments -arch […]

Добавление столбцов разной длины в кадр данных pandas

У меня есть данные, в которых подробно описаны деньги, предоставленные людям в течение нескольких лет: Name — Money — Year Paul 57.00 2012 Susan 67.00 2012 Gary 54.00 2011 Paul 77.00 2011 Andrea 20.00 2011 Albert 23.00 2011 Hal 26.00 2010 Paul 23.00 2010 Из этого фрейма я хочу построить блок данных, в котором указаны […]

Возврат нескольких столбцов с помощью pandas и пользовательских функций

Скажем, у меня есть функция: def fn(x) y = x ** 2 z = x ** 3 return y, z И я хочу использовать df['x'].apply(lambda x: fn(x)) чтобы возвращать y и z в отдельных столбцах. Есть ли хороший способ сделать это, используя fn(x) ? На самом деле моя функция будет намного сложнее, поэтому я хочу […]

Pandas Groupby Название дня

У меня есть набор данных, который включает поле времени даты, называемое «pub_date». In [69]: dataset[['pub_date']].dtypes Out[69]: pub_date datetime64[ns] dtype: object Я пытаюсь группировать набор данных по названию дня (например, Mon, Tue, …, Sat, Sun) безрезультатно. До сих пор мой подход заключался в создании полей для всех различных способов группировки данных. Поэтому я смог получить год, […]

Операции серии Pandas очень медленные после обновления

Я вижу огромную разницу в производительности между pandas 0,11 и pandas 0.13 на простых операциях серии. In [7]: df = pandas.DataFrame({'a':np.arange(1000000), 'b':np.arange(1000000)}) In [8]: pandas.__version__ Out[8]: '0.13.0' In [9]: %timeit df['a'].values+df['b'].values 100 loops, best of 3: 4.33 ms per loop In [10]: %timeit df['a']+df['b'] 10 loops, best of 3: 42.5 ms per loop Однако в […]

Данные цены от yahoo finance (или google finance), которые точнее, чем одна точка в день

Можно ли получить исторические данные о ценах из финансов yahoo (или google), используя pandas.io.data.yahoo в python с разрешением часа или 10 минут вместо 1 пункта в день? Если это невозможно, это ограничение модуля pandas или yahoo (google) finance API?

Подавлять описательный вывод при печати рамки данных pandas

Скажем, у меня есть dataframe, c : a=np.random.random((6,2)) c=pd.DataFrame(a) c.columns=['A','B'] значения строки печати 0: print c.loc[(0),:] результаты: A 0.220170 B 0.261467 Name: 0, dtype: float64 Я хотел бы подавить строку Name: 0, dtype: float64 чтобы я просто получил: A 0.220170 B 0.261467 Кто-нибудь знает как? (nb Я добавляю это в текстовый файл)

На графике pandas hist () с субгистограммами, как вставлять заголовки для осей x и y и общий заголовок?

Я использую метод pandas hist () с опцией 'by', в частности: histos=data_ok._DiffPricePercent.hist(by=input_data._Category, sharex=True, sharey=True ) Эта команда создает этот график: Как добавить заголовки для осей x и y на каждой из субгистограмм или, альтернативно, в целом? Также, как вставить общий заголовок для сюжета? Я пробовал следующее, но он не проходит (с ошибкой «AttributeError:« numpy.ndarray »объект […]

Interesting Posts for Van-Lav
Python - лучший язык программирования в мире.