Tag: pandas

использовать час единица в пандах to_timedelta

Из документа pandas pandas.to_timedelta (arg, box = True, unit = 'ns'), устройство объяснено следующим образом: unit of the arg (D,h,m,s,ms,us,ns) denote the unit, which is an integer/float number Поэтому я думаю, что «h» должно быть временем. но кажется, что я ошибаюсь, потому что ниже пример не работает должным образом: import pandas as pd base = […]

Форматирование JSON из фрейма данных Pandas для Highcharts в шаблоне Django

У меня есть кадр данных Pandas, который я преобразовал в JSON так: json_data = data_df.to_json() Исходный кадр данных выглядит примерно так: col1 col2 col3 col4 0 1 2 2 -1 1 2 4 3 -2 2 3 6 4 -3 3 4 8 5 -4 4 5 10 6 -5 … И строка JSON выглядит […]

Слияние pandas категориальных серий с переименованием

Я ищу способ объединить категории одного объекта pandas.Series в категории другого. import pandas as pd from pandas import Series, Categorical N = Series(["a","b","c","a"], dtype="category", name = "NEW_TEST") N1 = N.copy() N2 = N.copy() Работает N1.cat.categories = ['AA', 'BB', 'CC'] Выдает ошибку ValueError: Categorical categories must be unique N2.cat.categories = ['AA', 'AA', 'CC'] Я хотел бы […]

Как перепрограммировать dataframe с подсчетами в новый столбец и заполнить столбец в список

У меня есть DataFrame с измерениями следующего вида: label 2015-01-17 20:58:00.740000 cc 2015-01-19 04:36:00.740000 xy 2015-01-19 09:48:00.740000 ab 2015-01-19 09:52:00.740000 ab 2015-01-20 11:45:00.740000 ab И хотите переделать его по дням, создайте новый столбец с подсчетами и агрегируйте метки в список. Таким образом, я получаю следующий результат: counts label 2015-01-17 1 [cc] 2015-01-18 0 [] 2015-01-19 […]

Преобразование индексированного DataFrame в мультииндексированный с использованием шаблона в индексах

У меня есть DataFrame со следующей структурой (т.е. индексы имеют некоторые лексические пересечения): ab bar foo bah foo A1B1 1 0 3 2 A1B2 5 4 7 6 A2B1 9 8 11 10 A2B2 13 12 15 14 Я хочу, чтобы этот DataFrame был преобразован в это (т. Е. Мультииндекс из индекса с использованием некоторого […]

df.to_sql дает TypeError с dtype = sqlalchemy.timestamp (timezone = True)

Я пытаюсь использовать DataFrame (). To_sql для ввода временных рядов данных. Вот пример моего кода. times = ['201412120154', '201412110254'] df = pd.DataFrame() df['time'] = pd.to_datetime(times, utc=True) df.time.to_sql('test', engine, dtype={'time': sqlalchemy.TIMESTAMP(timezone=True)}) Я получаю ошибку: TypeError: issubclass() arg 1 must be a class Следующий код работает, но, очевидно, приводит к столбцу postgresql, который не осведомлен о часовом […]

Выберите строки из pandas DataFrame определенной даты

Я довольно новичок в пандах и проблема с манипулированием DataFrame. То, что у меня есть, – это DataFrame с повторяющимися датами, и я хотел бы сохранить только даты, которые будут ежечасно. Вот пример моего текущего DataFrame: Time ColA ColB 5/12/2011 10:00:00 PM 9 4 5/12/2011 10:15:00 PM 5 3 5/12/2011 10:30:00 PM 1 1 5/12/2011 […]

Используя представление столбцов из панд?

Возможно ли создать представление значений в столбце pandas без создания копии? Пример: import numpy as np import pandas as pd class Aclass: pass df = pd.DataFrame(np.random.rand(8,2),columns=['a','b']) Это работает: Aclass.a = df['a'] Aclass.a is df['a'] Out[51]: True Но не это: Aclass.a = df['a'].values Aclass.a is df['a'].values Out[54]: False Я хочу сделать это как способ постепенного включения […]

Добавление пробела между словами после умножения 2 столбцов df в Python

Мой кадр данных выглядит так: column 1 | column 2 apple | 3 banana | 4 carrot | 1 С помощью print df["column 1"] * df["column 2"] returns appleappleapple bananabananabananabanana carrot однако я хочу, чтобы слова были разнесены, т.е. apple apple apple banana banana banana banana carrot Наверное, действительно основные, но как это можно сделать? […]

Как настроить тип данных в Pandas?

Я практиковал функцию MulitIndex в пандах, но она не работает так, как я ожидал. Я думаю, это потому, что моих фундаментальных знаний недостаточно. from StringIO import StringIO # io.StringIO on python 3.X import pandas as pd datacsv = StringIO("""\ date,id,a,b 20150209,42366,7644,6366 20150209,52219,2741,1796 20150209,52831,163,145 20150209,53209,1047,862 20150209,53773,31343,22501 20150209,58935,16621,14873 20150209,65464,19838,12177 20150209,65823,4903,2982 20150209,68497,16564,12207 20150209,79230,48714,37355 20150208,42366,7644,6366 20150208,52219,2741,1796 20150208,52831,163,145 20150208,53209,1047,862 20150208,53773,31343,22501 […]

Interesting Posts for Van-Lav

Python уменьшает объяснение

Поддержка нескольких версий API в колбе

Гистограмма изображения «Уровень черных чернил» по горизонтальной оси

Удаление специальных символов из ключей проанализированного XML-файла с помощью xmltodict

Сохранить массив на основе numpy в разных строках файла excel

Самый быстрый способ загрузки огромного .dat в массив

Python all () и bool () пустые случаи?

Зачем делать списки неумелыми?

Как заставить XPath возвращать «None» в Python, если атрибут не найден?

Лучший язык для симулятора Molecular Dynamics, который будет запущен в производство. (Python + Numpy?)

Python: как рассчитать длину диапазона без создания диапазона?

Преобразование списка строк в список кортежей в python

Как я могу создавать функции, которые обрабатывают многочлены?

Должно ли мое приложение по умолчанию развертываться на appspot.com?

Поле, связанное с фильтром Django, с помощью настраиваемого менеджера соответствующей модели

Python - лучший язык программирования в мире.