Tag: dataframe

pandas преобразуют таймеры в несколько столбцов DataFrame

У меня есть временные данные внутридневных данных, как показано ниже. ts =pd.Series(np.random.randn(60),index=pd.date_range('1/1/2000',periods=60, freq='2h')) Я надеюсь преобразовать данные в DataFrame, со столбцами как каждую дату, а строки – как время в дате. Я пробовал это, key = lambda x:x.date() grouped = ts.groupby(key) Но как преобразовать группы в столбцы DataFrame с датой даты? или есть лучший способ?

Строить список из имен столбцов Pandas DataFrame

Поэтому я работаю на довольно большом наборе данных. Я использую Pandas DataFrame для обработки этих данных и застрял на эффективном способе анализа данных в двух отформатированных списках ЗДЕСЬ МОЙ ОБЪЕКТ ДАННЫХ fet1 fet2 fet3 fet4 fet5 stim1 True True False False False stim2 True False False False True stim3 …………………………….. stim4 …………………………….. stim5 ……………………….. so […]

pandas на n секунд и применить произвольную функцию качения

У меня есть данные csv с показаниями акселерометра в следующем формате (не это точно, реальные данные имеют более высокую частоту дискретизации): 2013-09-28 17: 36: 50.322120, 0.152695, -0.545074, -0.852997 2013-09-28 17: 36: 50,622988, 0,141800, -0,554947, -0,867935 2013-09-28 17: 36: 51,923802, 0,132431, -0,547089, -0,879333 2013-09-28 17: 36: 52.124641, 0.124329, -0.530243, -0.887741 2013-09-28 17: 36: 52.425341, 0.122269, -0.519669, […]

Добавление столбцов разной длины в кадр данных pandas

У меня есть данные, в которых подробно описаны деньги, предоставленные людям в течение нескольких лет: Name — Money — Year Paul 57.00 2012 Susan 67.00 2012 Gary 54.00 2011 Paul 77.00 2011 Andrea 20.00 2011 Albert 23.00 2011 Hal 26.00 2010 Paul 23.00 2010 Из этого фрейма я хочу построить блок данных, в котором указаны […]

В Python (Pandas / Numpy), как подмножить df, используя условие и определенный размер блока?

У меня есть df A = pd.DataFrame([[1, 5, 2, 0], [2, 4, 4, 0], [3, 3, 1, 1], [4, 2, 2, 0], [5, 1, 4, 0], [2, 4, 4, 0], [3, 3, 1, 1], [4, 2, 2, 0], [5, 1, 4, 0]], columns=['A', 'B', 'C', 'D'], index=[1, 2, 3, 4, 5, 6, 7, 8, 9]) […]

Pandas: удаление всех столбцов с помощью nans, 0 и NA из DataFrame

У меня есть DataFrame, который выглядит так: import pandas as pd import numpy as np df = pd.DataFrame({'A': [1, 2.1, np.nan, 4.7, 5.6, 6.8], 'B': [0, np.nan, np.nan, 0, 0, 0], 'C': [0, 0, 0, 0, 0, 0.0], 'D': [5, 5, 5, 5, 5.6, 6.8], 'E': ['NA', 'NA', 'NA', 'NA', 'NA', 'NA'],}) Как бы я […]

Как найти повторяющиеся индексы в DataFrame?

У меня есть pandas DataFrame с многоуровневым индексом («экземпляр» и «индекс»). Я хочу найти все значения индекса первого уровня («экземпляр»), которые не являются уникальными и распечатывают эти значения. Мой кадр выглядит так: A instance index a 1 10 2 12 3 4 b 1 12 2 5 3 2 b 1 12 2 5 3 […]

Поиск последних значений до определенного значения в numpy / pandas

У меня есть серия pandas, и я хочу найти индекс / позицию (или булевскую маску) последних раз, когда какое-то значение появляется перед некоторым другим конкретным значением. Например: df = pd.DataFrame({'x':np.random.randint(10, 1000000)}) Я хочу найти все местоположения 0, которые будут последними, до 9. Поэтому, если мой массив был [9, 0, 3, 0, 1, 9, 4, 9, […]

sql select group, имея счет (1)> 1 эквивалент в python pandas?

Мне сложно фильтровать элементы groupby в groupby . я хочу делать select email, count(1) as cnt from customers group by email having count(email) > 1 order by cnt desc я сделал customers.groupby('Email')['CustomerID'].size() и он дает мне список писем и их соответствующих учетных записей правильно, но я не могу получить having count(email) > 1 часть. email_cnt[email_cnt.size […]

Как преобразовать последние несколько столбцов в целое число из строкового типа в пандах

У меня есть df, называемый df . Я хочу преобразовать последние 10 столбцов этого фрейма данных из строкового типа в целые числа. Как я могу сделать это с питоническим путем?

Python - лучший язык программирования в мире.