Tag: pandas

pandas Диаграмма данных DataFrame

Каков эффективный способ получить диагональ квадрата DataFrame . Я ожидаю, что результатом будет Series с MultiIndex с двумя уровнями, первая из которых является индексом DataFrame вторым уровнем которого являются столбцы DataFrame . Настроить import pandas as pd import numpy as np np.random.seed([3, 1415]) df = pd.DataFrame(np.random.rand(3, 3) * 5, columns = list('abc'), index = list('ABC'), […]

как объединить два столбца с if / else в python pandas?

Я очень новичок в Пандах (т. Е. Менее 2 дней). Однако я не могу представить правильный синтаксис для объединения двух столбцов с условием if / else. Фактически, я выяснил один способ сделать это, используя «zip». Это то, чего я хочу достичь, но, похоже, в пандах может быть более эффективный способ сделать это. Для полноты я […]

Как выполнить итерацию по двум столбцам панды

In [35]: test = pd.DataFrame({'a':range(4),'b':range(4,8)}) In [36]: test Out[36]: ab 0 0 4 1 1 5 2 2 6 3 3 7 In [37]: for i in test['a']: ….: print i ….: 0 1 2 3 In [38]: for i,j in test: ….: print i,j ….: ———————————————————— Traceback (most recent call last): File "<ipython console>", […]

поиск полос в рамке данных панд

У меня есть рамка данных pandas следующим образом: time winner loser stat 1 AB 0 2 CB 0 3 DB 1 4 EB 0 5 FA 0 6 GA 0 7 HA 0 8 IA 1 каждая строка является результатом сопоставления. первый столбец – время матча, второй и третий столбцы содержат победитель / проигравший, а […]

Более эффективный способ очистки столбца строк и добавления нового столбца

У меня есть dataframe df который имеет столбцы ['metric_type', 'metric_value'] . Для каждой строки я хочу убедиться, что у меня есть столбец с именем, равным 'metric_type' и значением для этого столбца, равным 'metric_value' . Одна из моих проблем заключается в том, что 'metric_type' имеет ложные пространства, от которых я хочу избавиться. Рассмотрим dataframe df : […]

Как преобразовать numpy datetime64 в datetime

Я в основном сталкиваюсь с той же проблемой, что и здесь: Преобразование между датами, Timestamp и datetime64 но я не мог найти удовлетворительного ответа от него, мой вопрос, как извлечь datetime из numpy.datetime64 типа: если я попробую: np.datetime64('2012-06-18T02:00:05.453000000-0400').astype(datetime.datetime) это дало мне: 1339999205453000000L мое текущее решение конвертирует datetime64 в строку, а затем снова возвращается к дате. […]

Pandas TimeGrouper и Pivot?

Это выглядит так: Timestamp CAT 0 2016-12-02 23:35:28 200 1 2016-12-02 23:37:43 200 2 2016-12-02 23:40:49 300 3 2016-12-02 23:58:53 400 4 2016-12-02 23:59:02 300 … Это то, что я пытаюсь сделать в Pandas (обратите внимание, что временные метки сгруппированы): Timestamp BINS 200 300 400 500 2016-12-02 23:30 2 0 0 0 2016-12-02 23:40 0 […]

Самый быстрый способ сравнить строку и предыдущую строку в кадре данных pandas с миллионами строк

Я ищу решения для ускорения функции, которую я написал, чтобы пропустить рамку данных pandas и сравнить значения столбцов между текущей строкой и предыдущей строкой. Например, это упрощенная версия моей проблемы: User Time Col1 newcol1 newcol2 newcol3 newcol4 0 1 6 [cat, dog, goat] 0 0 0 0 1 1 6 [cat, sheep] 0 0 0 […]

Преобразование рядов Float в целую серию в пандах

У меня есть следующий фрейм данных: In [31]: rise_p Out[31]: time magnitude 0 1379945444 156.627598 1 1379945447 1474.648726 2 1379945448 1477.448999 3 1379945449 1474.886202 4 1379945699 1371.454224 Теперь я хочу сгруппировать строки, которые находятся в пределах одной минуты. Поэтому я разделяю временные ряды на 100. Я получаю это: In [32]: rise_p/100 Out[32]: time magnitude 0 […]

Преобразование временного диапазона pandas dataframe

У меня есть данные: Symbol bid ask Timestamp 2014-01-01 21:55:34.378000 EUR/USD 1.37622 1.37693 2014-01-01 21:55:40.410000 EUR/USD 1.37624 1.37698 2014-01-01 21:55:47.210000 EUR/USD 1.37619 1.37696 2014-01-01 21:55:57.963000 EUR/USD 1.37616 1.37696 2014-01-01 21:56:03.117000 EUR/USD 1.37616 1.37694 Временная метка имеет GMT. Есть ли способ преобразовать это в Восточный? Заметьте, когда я это сделаю: data.index Я получаю вывод: <class 'pandas.tseries.index.DatetimeIndex'> […]

Python - лучший язык программирования в мире.