Tag: pandas

Нестандартное взаимодействие между двумя таблицами, чтобы избежать очень большого слияния

Предположим, что у меня две таблицы A и B Таблица A имеет многоуровневый индекс (a, b) и один столбец (ts). b определяет однозначно ts. A = pd.DataFrame( [('a', 'x', 4), ('a', 'y', 6), ('a', 'z', 5), ('b', 'x', 4), ('b', 'z', 5), ('c', 'y', 6)], columns=['a', 'b', 'ts']).set_index(['a', 'b']) AA = A.reset_index() Таблица B – […]

Как применить условие на уровне pandas.multiindex?

Мои данные выглядят так: (ch = channel, det = детектор) ch det time counts 1 1 0 123 2 0 121 3 0 125 2 1 0 212 2 0 210 3 0 210 1 1 1 124 2 1 125 3 1 123 2 1 1 210 2 1 209 3 1 213 Обратите […]

pandas read_csv () вводит локальные строки datetime, tz_convert to UTC

Я использую pandas-0.8rc2 для чтения входного CSV с двумя столбцами локализованных строк даты и времени, лишенными информации о смещении UTC, и нуждаются в правильном преобразовании последовательностей dataframe в UTC. Я пробовал обходные пути, чтобы уменьшить тот факт, что ни столбцы временной метки не представляют собой индекс, а данные. tz_localize и tz_convert, по-видимому, работают только с […]

Pandas: сворачивает фрейм данных

Извините заранее за вопрос супер-новичка. Я учусь использовать панды, и у меня есть такая простая операция, что я не могу понять, как это сделать: У меня есть следующий фрейм данных: print df Out[19]: USERNAME REQUEST_TYPE STATUS LATENCY 0 foo 1 SUCCESS 7 1 foo 2 SUCCESS 17 2 bar 1 SUCCESS 10 3 bar 2 […]

Гистограмма с осью прерывания и чересстрочной панелью цвета

У меня есть данные как те abcde alpha 5.51 0.60 -0.12 26.90 76284.53 beta 3.39 0.94 -0.17 -0.20 -0.20 gamma 7.98 3.34 -1.41 7.74 28394.93 delta 2.29 1.24 0.40 0.29 0.28 Я хочу сделать красивую опубликоваемую гистограмму, такую ​​как но с разрывом по оси y, поэтому мы можем определить вариации a , b , c […]

Заполнение высокочастотных окон при повышении дискретизации с помощью панд

Я преобразовываю низкочастотные данные на более высокую частоту с помощью панд (например, ежемесячно в день). При преобразовании я хотел бы, чтобы полученный высокочастотный индекс охватывал все низкочастотные окна. Например, предположим, что у меня есть месячная серия, например: import numpy as np from pandas import * data = np.random.randn(2) s = Series(data, index=date_range('2012-01-01', periods=len(data), freq='M')) s […]

Выходные панды сгруппированы по данным без агрегации

Предположим, у меня есть панда DF с 'A', 'B', 'C' как имя столбца ABC a1 b11 c11 a1 b12 c12 a2 b21 c21 a2 b22 c22 Я могу группировать «А», но могу ли я получить ABC a1 [b11,b12], [c11,c12] a2 [b21,b22], [c21,c22] без какой-либо агрегации? Надеемся, что порядок (b11 до b12) сохраняется как в исходной […]

Как разрезать многоиндексные столбцы в pandas DataFrames?

У меня есть объект DataFrame с 16 строками и 14671872 столбцами. Я не могу на всю жизнь понять, как нарезать этот массив в любое разумное время на четырехъядерном процессоре Dell T410 с 24 ГБ оперативной памяти. Я бы просто использовал транспонирование массива, потому что это намного быстрее, но тогда у меня будет MultiIndex в столбцах, […]

Индексация данных данных Pandas по дате

Поэтому Python с модулем pandas кажется отличным вариантом для Matlab и R. Вот почему я совсем недавно переключился на это. Там есть ресурсы, и я искал форум, но не нашел ничего подобного. Если у вас есть ссылки на некоторые учебники или другой полезный материал, отправьте их. Уэс МакКинни имеет большой и продуманный учебник по пандам. […]

pandas DataFrame Разделение столбца само по себе

У меня есть рамка данных панд, которую я заполнил: import pandas.io.data as web test = web.get_data_yahoo('QQQ') Dataframe выглядит так в iPython: In [13]: test Out[13]: <class 'pandas.core.frame.DataFrame'> DatetimeIndex: 729 entries, 2010-01-04 00:00:00 to 2012-11-23 00:00:00 Data columns: Open 729 non-null values High 729 non-null values Low 729 non-null values Close 729 non-null values Volume 729 […]

Interesting Posts for Van-Lav
Python - лучший язык программирования в мире.