Tag: dataframe

Возвращаемое подмножество на основе списка логических значений

Я пытаюсь разрезать фрейм данных на основе списка значений, как бы я это сделал? Скажем, у меня есть список, l, и он выглядит так: [0,1,0,0,1,1,0,0,0,1] Я хочу вернуть все строки в dataframe, df, на основе, если значение в списке равно 1. В этом примере я бы включил строки, где индекс равен 1, 4, 5 и […]

Как применять иерархию или мультииндекс к столбцам панды

Я видел множество примеров того, как упорядочивать индексы строк данных в иерархическом порядке, но я пытаюсь сделать то же самое для столбцов и не понимаю синтаксис: Данный: df = pd.DataFrame(np.random.randn(10,10), columns=['consumption', 'voltage', 'consumption', 'voltage', 'temperature', 'humidity', 'consumption', 'voltage','temperature','humidity'], index= pd.date_range('20000103',periods=10)) >>> df consumption voltage consumption voltage temperature \ 2000-01-03 -1.327735 -1.440285 0.317122 -1.120105 1.736651 2000-01-04 […]

Объединить список кадровых фреймов pandas

Было много подобных вопросов, но конкретно не было. У меня есть список кадров данных, и мне нужно объединить их вместе, используя уникальный столбец (date) . Имена полей разные, поэтому concat is out. Я могу вручную использовать df[0].merge(df[1],on='Date').merge(df[3],on='Date) и т. Д., Чтобы объединить каждый df один за другим, но проблема в том, что количество кадров данных […]

Сбросить столбцы Уровни MultiIndex

Есть ли более короткий способ сброса уровня MultiIndex столбца (в моем случае basic_amt ), кроме переноса его дважды? In [704]: test Out[704]: basic_amt Faculty NSW QLD VIC All All 1 1 2 4 Full Time 0 1 0 1 Part Time 1 0 2 3 In [705]: test.reset_index(level=0, drop=True) Out[705]: basic_amt Faculty NSW QLD VIC […]

Создание нескольких кадров данных в цикле

У меня есть список, каждый из которых является названием компании companies = ['AA', 'AAPL', 'BA', ….., 'YHOO'] Я хочу создать новый фрейм данных для каждой записи в списке. Что-то вроде (Псевдокод) for c in companies: c = pd.DataFrame() Я искал способ сделать это, но не могу его найти. Есть идеи?

добавьте поле в рамку данных pandas с столбцами MultiIndex

я искал ответ на этот вопрос, поскольку он кажется довольно простым, но пока еще ничего не нашел. Извиняюсь, если я что-то пропустил. У меня есть версия pandas 0.10.0, и я экспериментировал с данными следующей формы: import pandas import numpy as np import datetime start_date = datetime.datetime(2009,3,1,6,29,59) r = pandas.date_range(start_date, periods=12) cols_1 = ['AAPL', 'AAPL', 'GOOG', […]

Время вылета из даты и времени < в Пандах

Таким образом, у меня есть столбец «Дата» в моем кадре данных, где даты имеют формат, подобный этому 0 1998-08-26 04:00:00 Если я хочу только месяц и день, как я могу отказаться от тривиального часа?

Python Pandas: булевское индексирование по нескольким столбцам

несмотря на то, что есть как минимум два хороших учебника о том, как индексировать DataFrame в библиотеке pandas Python, я все еще не могу выработать элегантный способ SELECT для более чем одного столбца. >>> d = pd.DataFrame({'x':[1, 2, 3, 4, 5], 'y':[4, 5, 6, 7, 8]}) >>> d xy 0 1 4 1 2 5 […]

python: удалить все строки в dataframe pandas, содержащие строку

У меня есть данные dataframe с данными pandas, и я хочу удалить все строки, содержащие строку в любом столбце. Например, ниже мы видим, что столбец «gdp» имеет строку в индексе 3 и «cap» в индексе 1. data = y gdp cap 0 1 2 5 1 2 3 ab 2 8 7 2 3 3 […]

Python Pandas реплицирует строки в dataframe

Если данные выглядят так: Store,Dept,Date,Weekly_Sales,IsHoliday 1,1,2010-02-05,24924.5,FALSE 1,1,2010-02-12,46039.49,TRUE 1,1,2010-02-19,41595.55,FALSE 1,1,2010-02-26,19403.54,FALSE 1,1,2010-03-05,21827.9,FALSE 1,1,2010-03-12,21043.39,FALSE 1,1,2010-03-19,22136.64,FALSE 1,1,2010-03-26,26229.21,FALSE 1,1,2010-04-02,57258.43,FALSE И я хочу дублировать строки с IsHoliday равным TRUE, я могу сделать: is_hol = df['IsHoliday'] == True df_try = df[is_hol] df=df.append(df_try*10) Но есть ли лучший способ сделать это, поскольку мне нужно дублировать праздничные строки в 5 раз, и я должен добавить […]

Interesting Posts for Van-Lav

Регулярное выражение Python соответствует двум разным разделителям

Я python ноутбук очень медленно, когда я запускаю его на своем ноутбуке

Как удалить '\ n' из конца строк внутри списка?

Использование автоматизации пользовательского интерфейса Windows через CPython / pywin32?

Питонический способ найти, находится ли значение между двумя значениями в списке

Groupby / Sum в Python Pandas – количество нулей не отображается … иногда

Какой из них наиболее pythonic: установка модулей python через диспетчер пакетов (macports, apt) или через pip / easy_install / setuptools

Могу ли я задать пользовательскую переменную в Python MySQLdb?

Оптимизация кусочной функции в Scipy / python

Проверка пустого номера на входе

Тип вызова (1/2) возвращает целое число?

Как загрузить данные спутника NASA OPeNDAP с помощью python

Есть ли библиотека python, которая абстрагирует транспорт на основе IP – TCP, UDP, SCTP, TLS и т. Д.?

Обновление массива C при чтении входного файла

Найти / заменить URL-адрес в документе с помощью регулярного выражения Python

Python - лучший язык программирования в мире.