У меня есть временные данные внутридневных данных, как показано ниже. ts =pd.Series(np.random.randn(60),index=pd.date_range('1/1/2000',periods=60, freq='2h')) Я надеюсь преобразовать данные в DataFrame, со столбцами как каждую дату, а строки – как время в дате. Я пробовал это, key = lambda x:x.date() grouped = ts.groupby(key) Но как преобразовать группы в столбцы DataFrame с датой даты? или есть лучший способ?
Поэтому я работаю на довольно большом наборе данных. Я использую Pandas DataFrame для обработки этих данных и застрял на эффективном способе анализа данных в двух отформатированных списках ЗДЕСЬ МОЙ ОБЪЕКТ ДАННЫХ fet1 fet2 fet3 fet4 fet5 stim1 True True False False False stim2 True False False False True stim3 …………………………….. stim4 …………………………….. stim5 ……………………….. so […]
У меня есть данные csv с показаниями акселерометра в следующем формате (не это точно, реальные данные имеют более высокую частоту дискретизации): 2013-09-28 17: 36: 50.322120, 0.152695, -0.545074, -0.852997 2013-09-28 17: 36: 50,622988, 0,141800, -0,554947, -0,867935 2013-09-28 17: 36: 51,923802, 0,132431, -0,547089, -0,879333 2013-09-28 17: 36: 52.124641, 0.124329, -0.530243, -0.887741 2013-09-28 17: 36: 52.425341, 0.122269, -0.519669, […]
У меня есть данные, в которых подробно описаны деньги, предоставленные людям в течение нескольких лет: Name — Money — Year Paul 57.00 2012 Susan 67.00 2012 Gary 54.00 2011 Paul 77.00 2011 Andrea 20.00 2011 Albert 23.00 2011 Hal 26.00 2010 Paul 23.00 2010 Из этого фрейма я хочу построить блок данных, в котором указаны […]
У меня есть df A = pd.DataFrame([[1, 5, 2, 0], [2, 4, 4, 0], [3, 3, 1, 1], [4, 2, 2, 0], [5, 1, 4, 0], [2, 4, 4, 0], [3, 3, 1, 1], [4, 2, 2, 0], [5, 1, 4, 0]], columns=['A', 'B', 'C', 'D'], index=[1, 2, 3, 4, 5, 6, 7, 8, 9]) […]
У меня есть DataFrame, который выглядит так: import pandas as pd import numpy as np df = pd.DataFrame({'A': [1, 2.1, np.nan, 4.7, 5.6, 6.8], 'B': [0, np.nan, np.nan, 0, 0, 0], 'C': [0, 0, 0, 0, 0, 0.0], 'D': [5, 5, 5, 5, 5.6, 6.8], 'E': ['NA', 'NA', 'NA', 'NA', 'NA', 'NA'],}) Как бы я […]
У меня есть pandas DataFrame с многоуровневым индексом («экземпляр» и «индекс»). Я хочу найти все значения индекса первого уровня («экземпляр»), которые не являются уникальными и распечатывают эти значения. Мой кадр выглядит так: A instance index a 1 10 2 12 3 4 b 1 12 2 5 3 2 b 1 12 2 5 3 […]
У меня есть серия pandas, и я хочу найти индекс / позицию (или булевскую маску) последних раз, когда какое-то значение появляется перед некоторым другим конкретным значением. Например: df = pd.DataFrame({'x':np.random.randint(10, 1000000)}) Я хочу найти все местоположения 0, которые будут последними, до 9. Поэтому, если мой массив был [9, 0, 3, 0, 1, 9, 4, 9, […]
Мне сложно фильтровать элементы groupby в groupby . я хочу делать select email, count(1) as cnt from customers group by email having count(email) > 1 order by cnt desc я сделал customers.groupby('Email')['CustomerID'].size() и он дает мне список писем и их соответствующих учетных записей правильно, но я не могу получить having count(email) > 1 часть. email_cnt[email_cnt.size […]
У меня есть df, называемый df . Я хочу преобразовать последние 10 столбцов этого фрейма данных из строкового типа в целые числа. Как я могу сделать это с питоническим путем?