Tag: pandas

Вложение значений в группы с минимальным размером с использованием панд

Я пытаюсь объединить выборку наблюдений в n дискретных групп, а затем объединить эти группы, пока каждая подгруппа не будет иметь минимум 6 членов. До сих пор я создал бункеры и сгруппировал в них свой DataFrame: # df is a DataFrame containing 135 measurments bins = np.linspace(df.heights.min(), df.heights.max(), 21) grp = df.groupby(np.digitize(df.heights, bins)) grp.size() 1 4 […]

Панель Pandas: копирование и просмотр

Поэтому в основном, если я хочу изменить данные в исходном df , мне всегда нужно использовать .loc[] . Но рассмотрим следующие >>> import pandas as pd >>> from scipy import random >>> from numpy import arange >>> T, N = 4, 5 >>> TIndex = arange(0, T) >>> FIndex = arange(0, N) >>> wp = […]

Объединение двух фреймов данных в пандах без имен столбцов (новое для панд)

Краткое объяснение : Если у вас есть дубликаты имен столбцов в ваших данных, обязательно переименуйте один столбец при чтении файла. Если у вас есть NaN т. Д. В ваших данных, удалите их. Затем слейте правильный ответ ниже. Наверное, довольно простой вопрос. У меня есть два набора данных, которые я читал при использовании pandas.read_csv() . Мои […]

Добавление вычисленного столбца в pandas dataframe

Я совершенно новичок в Python, пандах и программировании в целом, и я не могу понять следующее: Я получил доступ к базе данных с помощью pandas, и я поместил данные из запроса в dataframe, df. Один из столбцов содержит дни рождения, которые могут иметь следующие формы: – 01/25/1980 (строка) – 01/25 (строка) – None (NoneType) Теперь […]

Серии с несколькими ключами в Pandas. Работа с промахами и дублирующими индексами

Кажется, есть три разных способа сделать несколько ключевых сечений в Pandas: Использование pd.IndexSlice Использование фильтра groupby Преобразование в панель, получение поперечного сечения и преобразование обратно в DataFrame Однако я не могу запускать решения, описанные в этих потоках. Позволь мне объяснить: Пример, который работает с idx : Скажем, я хочу получить поперечное сечение ['bar', 'flux'] связанное […]

Как выполнить повторную выборку данных внутрисетевого времени с помощью dateOffset в Pandas / Numpy?

Я имею дело с фьючерсами, где текущий день начинается до 00:00:00. Мне нужно сделать передискретизацию 1-минутных данных на 1 час данных с учетом смещения даты. Давайте посмотрим пример: df1 – данные 1 мин. Open High Low Close 2005-09-06 17:27:00 1234.75 1234.75 1234.75 1234.75 2005-09-06 17:28:00 1234.75 1234.75 1234.75 1234.75 2005-09-06 17:29:00 1234.75 1234.75 1234.75 1234.75 […]

Невозможно «установить установку numpy» на OS X Yosemite

Я не могу выполнить pip install pandas или pip install numpy после обновления до OS X Yosemite. Обе команды отлично работали раньше. Когда я бегу $ pip install numpy процесс компиляции работает около 30 секунд, а затем я получаю следующее: компиляция источников C C compiler: cc -DNDEBUG -g -fwrapv -Os -Wall -Wstrict-prototypes -Qunused-arguments -Qunused-arguments -arch […]

Добавление столбцов разной длины в кадр данных pandas

У меня есть данные, в которых подробно описаны деньги, предоставленные людям в течение нескольких лет: Name — Money — Year Paul 57.00 2012 Susan 67.00 2012 Gary 54.00 2011 Paul 77.00 2011 Andrea 20.00 2011 Albert 23.00 2011 Hal 26.00 2010 Paul 23.00 2010 Из этого фрейма я хочу построить блок данных, в котором указаны […]

Возврат нескольких столбцов с помощью pandas и пользовательских функций

Скажем, у меня есть функция: def fn(x) y = x ** 2 z = x ** 3 return y, z И я хочу использовать df['x'].apply(lambda x: fn(x)) чтобы возвращать y и z в отдельных столбцах. Есть ли хороший способ сделать это, используя fn(x) ? На самом деле моя функция будет намного сложнее, поэтому я хочу […]

Pandas Groupby Название дня

У меня есть набор данных, который включает поле времени даты, называемое «pub_date». In [69]: dataset[['pub_date']].dtypes Out[69]: pub_date datetime64[ns] dtype: object Я пытаюсь группировать набор данных по названию дня (например, Mon, Tue, …, Sat, Sun) безрезультатно. До сих пор мой подход заключался в создании полей для всех различных способов группировки данных. Поэтому я смог получить год, […]

Interesting Posts for Van-Lav

Как увидеть выход печати из генератора до окончания цикла?

Устранение гауссовского кода по модулю 2 python

Уникальная проверка на вложенном сериализаторе в Django Rest Framework

Как вычислить r-квадрат с использованием Python и Numpy?

превращение панд в выражение pyspark

Как инициализировать переменную с tf.get_variable и значением numpy в TensorFlow?

Как получить первый оператор #include в файлах на C ++ с использованием регулярного выражения Python?

Невозможно вставить данные с PyMySQL, когда я использую параметр

Начало работы с Pylons

Является ли API-интерфейс Python Google Spreadsheet или gspread разрешать изображения или богатый текст?

Существует ли R-эквивалент пифонического «if __name__ ==» __main__ »: main ()??

переменные шаблона mandrill не заменяют

Как сделать сообщение с данными из пустого json через HTTPie?

Как получить URL-адрес от Beautiful Soup?

Как получить плоскую кластеризацию, соответствующую цветным кластерам в дендрограмме, созданной scipy

Python - лучший язык программирования в мире.