Tag: pandas

Как прекратить линейный график в сюжете pandas или matplotlib python

Моя задача заключается в построении множества последовательностей данных, организованных в столбце (где каждый столбец является данными для многих симуляций для одного и того же идентификатора (ID)), а индекс кадра данных pandas – это месяцы моделирования. Проблема заключается в строке, созданной пандами, связывающими различные симуляции в том же столбце. Посмотрите на пример, который воспроизводит проблему. Как […]

Объединение Pandas DataFrames на основе комбинации индекса / столбца

У меня есть два DataFrames, которые я хочу объединить . Я читал о слиянии нескольких столбцов и сохранении индекса при слиянии . Моя проблема должна удовлетворять обоим, и мне трудно понять, как это сделать. Первый DataFrame выглядит так: а вторая выглядит так Я хочу объединить их на основе Date и ID . В первом DataFrame […]

Pandas: исключение при построении двух кадров данных на одном графике

У меня есть два Pandas DataFrame, которые я пытаюсь построить на одном графике. all_data: нужно построить это как линейный граф points_of_interest: нужно построить это как график рассеяния на одном графике Вот код, который я использую для их построения: axes = all_data[ASK_PRICE].plot(figsize=(16, 12)) points_of_interest[ASK_PRICE].plot(figsize=(16, 12), ax = axes, kind='scatter') pylab.show() Когда я запускаю этот код, он […]

Как обменивать индекс и значения в кадре данных pandas

У меня есть некоторые данные, в которых индекс является порогом, а значения представляют собой trns (истинные отрицательные ставки) для двух классов: 0 и 1. Я хочу получить dataframe, проиндексированный tnr, порога, который соответствует этому tnr, для каждого класса. По сути, я хочу: Я могу добиться этого эффекта, используя следующее: pd.concat([pd.Series(data[0].index.values, index=data[0]), pd.Series(data[1].index.values, index=data[1])], axis=1) Или, […]

Сохранять тип данных столбца Dataframe после внешнего слияния

Когда вы объединяете два фрейма данных с индексом, который объединяется с некоторыми значениями, но не на всех с использованием «внешнего» слияния, python / pandas автоматически добавляет значения Null (NaN) в поля, которые он не может сопоставить. Прекрасно это нормальное поведение, но оно меняет тип данных. Это проблема, потому что теперь вам нужно повторить, какие типы […]

Объединение двух серий панд с изменяющейся логикой

У меня две серии данных bool, которые я хотел бы объединить с новым объектом серии, но логика комбинации зависит от «истории» (предыдущие значения). Series1 содержит в основном False, но одно значение True. Серия 2 обычно содержит периоды значений True или False – вероятность повторения значений довольно высока. В результирующей серии мне нужны периоды значений bool, […]

Группировка по годам / месяцам / дням в пандах

Предположим, что у вас следующий DataFrame : rng = pd.date_range('1/1/2011', periods=72, freq='H') np.random.seed(10) n = 10 df = pd.DataFrame( { "datetime": np.random.choice(rng,n), "cat": np.random.choice(['a','b','b'], n), "val": np.random.randint(0,5, size=n) } ) Если я сейчас groupby : gb = df.groupby(['cat','datetime']).sum() Я получаю итоговые значения для каждой cat за каждый час: cat datetime val a 2011-01-01 00:00:00 1 […]

Почему Pandas принуждает мой numpy float32 к float64?

Почему Pandas принуждает мой numpy float32 к float64 в этом фрагменте кода: >>> import pandas as pd >>> import numpy as np >>> df = pd.DataFrame([[1, 2, 'a'], [3, 4, 'b']], dtype=np.float32) >>> A = df.ix[:, 0:1].values >>> df.ix[:, 0:1] = A >>> df[0].dtype dtype('float64') Поведение кажется мне таким странным, что интересно, если это ошибка. […]

Запрос Pandas read_sql с несколькими выборами

Может ли запрос read_sql обрабатывать SQL-скрипт с несколькими операторами выбора? У меня есть запрос MSSQL, который выполняет разные задачи, но я не хочу писать индивидуальный запрос для каждого случая. Я хотел бы написать только один запрос и вытащить несколько таблиц. Я хочу, чтобы несколько запросов в том же скрипте, потому что запросы связаны, и это […]

Возвращать предсказанные значения из скользящей регрессии, сгруппированной по идентификатору с использованием Pandas

Я пытаюсь вычислить ежемесячные регрессионные окна качения и вернуть предсказанные значения в качестве нового столбца в фрейме данных. Я знаю, что у Pandas есть возможности регрессионной регрессии ( pandas.ols ), которые находятся в процессе обесценения, поэтому меня интересует решение, которое использует statsmodels или что-то подобное. Я бы хотел рассчитать ежемесячные скользящие регрессии (12-месячное окно, минимум […]

 
Interesting Posts for Van-Lav

Где можно скачать образец шаблона Django?

Сохранять конечные записи только в Pandas

Django admin – Как добавить знак «зеленый плюс» для поля «Множество ко многим» в пользовательской форме администратора

Cython – преобразование указателей на массивы в объекты Python

Как я могу «переопределить» глубину в Python?

Анализ ввода строки до тех пор, пока не достигнет определенной буквы на Python

Как очистить Instagram с помощью BeautifulSoup

Преобразование программы из QBasic в Python

Как предотвратить случайную публикацию Pacon pacakge с помощью setup.py

Возвращение struct из c ++ dll в Python

Самый быстрый способ разделить конкатенированную строку на кортеж и игнорировать пустые строки

psycopg2 не удается выполнить много операторов с синтаксической ошибкой

В pandas, как я могу сбросить индекс без добавления нового столбца?

Почему с Django не документирована ручная интеграция с Django?

Python проверяет, работает ли процесс или нет.

Python - лучший язык программирования в мире.