Tag: pandas

python dataframe конвертировать число недель в месяц

Я пытаюсь добавить новый столбец, который преобразует столбец недели в соответствующий месяц, в который входит неделя. Если неделя разделить на 2 месяца, то возьмите максимальный месяц в качестве ответа. import pandas as pd data = {'Week': [201301, 201301, 201302, 201302, 201303], 'product': ['coke', 'fanta', 'coke' ,'sprite' ,'pepsi'], 'quantity': [1.5, 1.7, 3.6, 2.4, 2.9]} df = […]

Выберите строки вокруг значения в Pandas

У меня есть DataFrame с непрерывной мерой, отмеченной случайными событиями: TimeIndex Event Value 0 NaN 4.099969 1 NaN 3.833528 2 NaN -1.335025 3 A 4.420085 4 NaN 4.508899 5 NaN 4.557383 6 B -3.377152 7 NaN 4.508899 8 NaN -1.919803 9 A 2.18520 10 NaN 3.821221 11 C 0.922389 12 NaN 2.165784 Я хочу средний […]

Pandas Dataframe Stacking and Pivoting

Я использую pandas для изменения некоторых строковых / числовых значений, и я столкнулся с некоторым поведением, которое немного противоречит интуиции. Может ли кто-нибудь объяснить разницу между фреймами данных, stacked и pivoted ниже, и почему pivoted2 повышает значение DataError даже если не aggfunc ? import pandas as pd d = {'ID': pd.Series(['x']*3 + ['y']*3,index = range(6)), […]

Множественное индексирование подмножества подмножества данных панд

Первая проблема здесь – ошибка в 0.12, но была зафиксирована в 0.13.0rc1. Вторая проблема здесь не исправлена ​​и, по крайней мере, является несогласованностью. Эти два сценария работают нормально: a = DataFrame(np.zeros((2, 2), dtype=float),columns=[['a', 'B'],[1, 2]]) b = DataFrame(np.zeros((2, 2), dtype=float),columns=[['a', 'B']]) b[['a']]=a[['a']] а также a = DataFrame(np.zeros((2, 2), dtype=float),columns=[['a', 'b'],[1, 2]]) b = DataFrame(np.zeros((2, 2), […]

Повторная выборка данных OHLC и заполнение пробелов в Pandas

У меня есть данные по тику в этой форме: date price amount 2011-09-13 13:53:36 5.80 1.0000 2011-09-13 13:53:44 5.83 3.0000 2011-09-13 14:32:53 5.90 2.0000 И я пересмотрел цену с помощью: resampledData.price.resample('55min', how="ohlc") Теперь мне нужно заполнить недостающие данные, и единственный способ, которым я придумал: closes = resampledData.close closes = closes.fillna(method='pad') resampledData = resampledData.open.fillna(closes) resampledData = […]

Удалить строки, содержащие определенный шаблон

Я новичок в Python и Pandas, я потратил много времени на поиск, но не смог найти ответ на мою конкретную проблему. У меня есть dataframe, где первые несколько строк – это только комментарии, начинающиеся с '#', за которыми следует обычный фреймворк данных, содержащий строки и столбцы. У меня есть сотни таких текстовых файлов, которые мне […]

Store Numpy как маринованные панды, маринованные ножи или HDF5

Я сейчас работаю с 300 функциями float, поступающими из предварительной обработки информации о позиции. Такие элементы идентифицируются с помощью UUID (т.е. строки). Текущий размер файла составляет около 200 МБ. До сих пор я сохранил их как массивы Pickled numpy . Иногда мне нужно сопоставить UUID для элемента в строке Numpy. Для этого я использую словарь […]

Выравнивание / поворот текстовых меток по оси x в matplotlib с 3 графиками

Как я могу выровнять текстовые метки с тикерами x на графике здесь? Я использую host.set_xticklabels (метки, rotation = 'vertical'), но это, похоже, не работает. Мои ярлыки – это предложения, а некоторые могут быть меньше / больше, чем другие, например «Мумия возвращает часть 2». Как заполнить пробел ниже оси x, чтобы это было уместно? from mpl_toolkits.axes_grid1 […]

Python / Numpy – заполнять промежутки между непоследовательными точками?

Я пытаюсь найти vectorized / fast / numpy дружественный способ преобразования следующих значений в столбце A, в столбец B: ID AB 1 0 0 2 0 0 3 1 0 4 1 1 5 0 1 6 0 1 7 -1 1 8 0 0 9 1 0 10 0 1 11 0 1 12 […]

Невозможно преобразовать pandas DataFrame в json, используя to_json

Я знаю, что есть несколько других сообщений о переполнении стека по этой же проблеме, однако ни одно решение, найденное на этих сообщениях, или любое другое сообщение, которое я нашел в Интернете, не работает. Я следил за многочисленными учебниками, видеороликами, книгами и сообщениями Stack Overflow на пандах, и все упомянутые решения потерпели неудачу. Неудача заключается в […]

Python - лучший язык программирования в мире.