Tag: dataframe

Создайте pandas DataFrame из файла csv stacked

Я хотел бы создать pandas DataFrame из следующего файла csv: ……….. EUR MS 3M;20111025;7d;1.1510; EUR MS 3M;20111024;7d;1.1530; EUR MS 3M;20111025;1m;1.1580; EUR MS 3M;20111024;1m;1.1590; ……….. В идеале DataFrame будет иметь имя, указанное в качестве значения первого столбца («EUR MS 3M»), индекс, составленный из значений во втором столбце («20111025»), и где имена столбцов для DataFrame будут взяты […]

Столбец данных с условными данными – Python

У меня есть несколько процентов в столбце фрейма данных pc 0.32 0.45 0.49 0.60 0.68 0.87 И я хочу закончить что-то вроде этого pc group 0.32 1 0.45 2 0.49 2 0.60 2 0.68 3 0.87 3 я пробовал df["group"]=3 if df["pc"]<0.66: df["group"]=2 elif df["pc"]<0.33: df["group"]=1 но все, что я получаю, это ValueError: The truth […]

Умножить int column по поплавковой константе pandas dataframe

У меня есть куча опрокинутых данных о осадках в ковше, записанных как количество советов за каждый минутный интервал. Я загрузил это в рамку данных pandas, и мне нужно иметь возможность умножать каждый отдельный столбец с помощью калибровочного коэффициента mm / tip, но столбец – тип int, а factor – тип float. Я пробовал: df ['Series'] […]

Функция Python Pandas groupby с динамическими параметрами для ежемесячного, ежечасного

В течение нескольких лет у меня есть часовой блок данных в следующем формате: Date/Time Value 01.03.2010 00:00:00 60 01.03.2010 01:00:00 50 01.03.2010 02:00:00 52 01.03.2010 03:00:00 49 . . . 31.12.2013 23:00:00 77 и я использую следующий код, чтобы получить среднее значение каждого часа за каждый год в данных: In [11]: year_hour_means = df1.groupby(lambda x: […]

эффективно группировать данные в пандах?

У меня есть следующий фрейм данных в пандах, где для каждой строки есть уникальный индекс ( employee ), а также type метки группы: df = pandas.DataFrame({"employee": ["a", "b", "c", "d"], "type": ["X", "Y", "Y", "Y"], "value": [10,20,30,40]}) df = df.set_index("employee") Я хочу сгруппировать сотрудников по type а затем рассчитать статистику для каждого типа. Как я […]

Преобразования с последовательностью экспорта данных DataFrame

У меня есть данные в следующем виде, хранящемся в DataFrame. Я хотел бы получать ежедневные суммы для каждой из метрик, сгруппированных по их типу, поэтому, например, общая сумма для linkedin_profiles 3 октября 2012 года. sample_date metric_name sample 2012-10-03 21:30:18.742307+00:00 linkedin_profile 257 2012-10-03 21:30:25.132189+00:00 twitter_profile 972 2012-10-03 21:30:26.063389+00:00 youtube_video 10393 2012-10-03 21:30:26.178347+00:00 youtube_video 2866 2012-10-03 21:30:26.215093+00:00 […]

Совокупность столбца только некоторыми ключами в кадре данных Pandas?

У меня есть dataframe, как это: k1 k2 k3 v1 v2 foo bar baz 20 40 foo bar baz 10 30 foo bar baz 5 20 foo bar qux 10 20 foo bar qux 10 30 foo bar qux 15 20 bar baz foo 10 15 bar baz foo 20 35 bar baz foo 10 […]

Как скопировать значения Pandas DataFrame вниз, чтобы заполнить 0?

Итак, в основном, как мне преобразовать DataFrame A в DataFrame B? A: Index Value 01 42 02 0 03 0 04 57 05 0 … … B: Index Value 01 42 02 42 03 42 04 57 05 57 … …

Как сэмплы pandas DataFrame с заменой?

У меня есть DataFrame, размер N. Мне нужно пробовать его с S образцами, с заменой, где N <S. def sampleDF(df, K): return df.ix[np.random.randint(0, len(df), size=k)] Я возвращаю новый DF, но кажется, что все заполнено NaN. Не уверен, что происходит!

Поиск частых пользователей в кадре данных pandas

У меня есть кадр данных pandas с столбцами с именем user_id и login_date, и я хотел бы получить идентификаторы частых пользователей (т. Е. Зарегистрированных не один раз) и частоту их входа в систему. Для этого я попытался: frequent_users = df.groupby(['login_date', 'user_id']).agg({"user_id": lambda x: x.count()}) и результат: 2011-01-17 556 1 456 1 958 1 374 2 […]

Python - лучший язык программирования в мире.