Tag: pandas

Сложная операция слияния панд

Я по-прежнему новичок в подключении / объединении данных в Pandas, поэтому очень ценю любую помощь для выполнения следующей операции. Я имею следующие три таблицы SQL (преобразованные в DataFrames) данных: df1 Out[14]: —- fruit price qty 2010 apple 1.0 2.0 2011 apple 3.0 4.0 2010 banana 0.5 1.5 2011 banana 7.0 8.0 df2 Out[15]: —- fruit […]

Невозможно проиндексировать дату в кадре данных Pandas из read_csv

Сегодня я столкнулся с проблемой, которую я не могу решить. Я прочитал файл csv, используя mydata = pd.read_csv(file_name, header=0, sep=",", index_col=[0], parse_dates=True) CSV выглядит так: 2009-12-10,5,6,7,8,9 2009-12-11,7,6,6,7,9 вместо получения индексированного фрейма данных я получаю следующий вывод: print mydata Empty DataFrame Columns: [] Index: [2009-12-10,5,6,7,8,9 2009-12-11,7,6,6,7,9] Пожалуйста помоги!! Я пробовал уже 2 часа! Большое спасибо

Проблемы с написанием файла в пандах

В настоящее время я пытаюсь написать файл excel из формата файла, используя функцию tr8 pd.to_excel из pandas. Тем не менее, он пишет файл excel, но при открытии в excel я не вижу полные данные. Я прикрепил код tr8 output_file = pd.ExcelWriter('20131001103311.xlsx') widths = [1, 8, 2, 4, 2, 5, 1, 5, 1, 5, 1, 5, […]

Индексирование кадра данных pandas для возврата первой точки данных с каждого дня

Возможно, новичок. В пандах у меня есть Dataframe с datetime в столбце (а не в индексе), который охватывает несколько дней и находится на нерегулярных временных интервалах (т.е. не периодических). Я хочу вернуть первое значение с каждого дня. Поэтому, если бы моя колонка datetime выглядела так: 2013-01-01 01:00 2013-01-01 05:00 2013-01-01 14:00 2013-01-02 01:00 2013-01-02 05:00 […]

R-Python: получение ежемесячных, недельных индексов

В пакете xts R есть функция, называемая endpoints которая задает объект xts, будет возвращать индекс, когда указанный месяц, неделя или любая указанная пользователем частота возвращается. Как можно сделать это в пандах с помощью python? Р: endpoints(xts.object, "frequency") Python: from matplotlib.pylab import * from pandas.io.data import DataReader from datetime import datetime symbols = ["SPY","IEF"] data_holder = […]

выбор наблюдения типа datetime64 в конкретном временном диапазоне

У меня есть pandas dfnew ( dfnew ), в котором один столбец (timestamp) имеет datetime64[ns] . Теперь я хочу посмотреть, сколько наблюдений в определенном диапазоне времени позволяет говорить с 10:00:00 до 12:00:00. dfnew['timestamp'] = dfnew['timestamp'].astype('datetime64[ns]') dfnew['timestamp] 0 2013-12-19 09:03:21.223000 1 2013-12-19 11:34:23.037000 2 2013-12-19 11:34:23.050000 3 2013-12-19 11:34:23.067000 4 2013-12-19 11:34:23.067000 5 2013-12-19 11:34:23.067000 6 […]

Вложение значений в группы с минимальным размером с использованием панд

Я пытаюсь объединить выборку наблюдений в n дискретных групп, а затем объединить эти группы, пока каждая подгруппа не будет иметь минимум 6 членов. До сих пор я создал бункеры и сгруппировал в них свой DataFrame: # df is a DataFrame containing 135 measurments bins = np.linspace(df.heights.min(), df.heights.max(), 21) grp = df.groupby(np.digitize(df.heights, bins)) grp.size() 1 4 […]

Панель Pandas: копирование и просмотр

Поэтому в основном, если я хочу изменить данные в исходном df , мне всегда нужно использовать .loc[] . Но рассмотрим следующие >>> import pandas as pd >>> from scipy import random >>> from numpy import arange >>> T, N = 4, 5 >>> TIndex = arange(0, T) >>> FIndex = arange(0, N) >>> wp = […]

Объединение двух фреймов данных в пандах без имен столбцов (новое для панд)

Краткое объяснение : Если у вас есть дубликаты имен столбцов в ваших данных, обязательно переименуйте один столбец при чтении файла. Если у вас есть NaN т. Д. В ваших данных, удалите их. Затем слейте правильный ответ ниже. Наверное, довольно простой вопрос. У меня есть два набора данных, которые я читал при использовании pandas.read_csv() . Мои […]

Добавление вычисленного столбца в pandas dataframe

Я совершенно новичок в Python, пандах и программировании в целом, и я не могу понять следующее: Я получил доступ к базе данных с помощью pandas, и я поместил данные из запроса в dataframe, df. Один из столбцов содержит дни рождения, которые могут иметь следующие формы: – 01/25/1980 (строка) – 01/25 (строка) – None (NoneType) Теперь […]

Python - лучший язык программирования в мире.