Tag: pandas

Преобразование данных Pandas

У меня есть следующие данные в кадре данных Pandas: AIRPORT EWR|JAX EWR|BHX EWR|BHX EWR|BHX EWR|BHX … Есть ли динамический способ конвертировать это в: AIRPORT EWR JAX BHX EWR|JAX YY NULL EWR|BHX Y NULL Y и так далее. Я знаю, как это сделать, если я хочу считать жестко закодированные значения df.assign(EWR = lambda x: x.TYPE.apply(lambda y: […]

Панды: эффективно выполнять многочисленные модификации имен столбцов

Как вы можете внести многочисленные изменения в столбцы dataframe, избегая шаблонного кода. Воспроизводимый пример: data = {'Subject Id': ['1', '2', '3'], 'First-Name': ['Alex', 'Amy', 'Allen'], 'Last, name': ['Anderson', 'Ackerman', 'Ali']} df = pd.DataFrame(data, columns = ['Subject Id', 'First-Name', 'Last, name']) df Subject Id First-Name Last, name 0 1 Alex Anderson 1 2 Amy Ackerman 2 […]

Расширенные возможности Python pandas

Я думаю, что это похоже на этот пост, но не совсем то же самое, и я не могу обойти его. Итак, у меня в настоящее время есть (довольно странный) фрейм данных pandas со списками в каждой ячейке: >>> data = pd.DataFrame({'myid' : ['1', '2', '3'], 'num' : [['1', '2', '3'], ['1', '2'], []], 'text' : […]

matplotlib Кривая доходности казначейства США

В настоящее время я пытаюсь создать блок данных, состоящий из ежедневных ставок казначейства США. Как вы можете видеть, pandas автоматически форматирует столбцы так, чтобы они были в порядке, чего явно я не хочу. Вот некоторые из моего кода. Мне нужно было сделать небольшой пример, чтобы показать проблему, с которой я сталкиваюсь. import quandl import matplotlib.pyplot […]

Как отобразить конкретную цифру в кадре данных pandas

У меня есть dataframe, как показано ниже month 0 1 1 2 2 3 3 10 4 11 например, я хотел бы отобразить этот файл данных в 2-х цифрах, как это month 0 01 1 02 2 03 3 10 4 11 Я пробовал много методов, но не работал хорошо. Как я могу получить этот […]

Как эффективно регистрировать скорость изменения строк в Pandas DataFrame?

Предположим, у меня есть DataFrame ( в моем случае около 10000 строк, это всего лишь минимальный пример ) >>> import pandas as pd >>> sample_df = pd.DataFrame( {'col1': list(range(1, 10)), 'col2': list(range(10, 19))}) >>> sample_df col1 col2 0 1 10 1 2 11 2 3 12 3 4 13 4 5 14 5 6 15 […]

Заполнить значение во всех строках данных на основе значения

Итак, у меня есть dataframe следующим образом name, car foo, bmw bar, audi baz, tesla foobaz, bmw теперь у меня есть другой словарь, например car_type = {'bmw': 'gas', 'audi': 'hybrid', 'tesla': 'electric'} Теперь я хочу добавить новый столбец в dataframe, как показано ниже. name, car, type foo, bmw, gas bar, audi, hybric baz, tesla, electric […]

Переместить столбец для данных в панда данных

Я пытаюсь привести в порядок уже существующую базу данных панд. У меня есть файл csv, который я импортирую и выгляжу примерно следующим образом (это упрощенная версия): trial_num trial_name unit_1_act unit_2_act unit_3_act unit_4_act 0 face 0.0 0.000000 0.272244 0.006428 1 face 0.0 0.000000 0.898450 0.000000 2 face 0.0 0.893845 0.000000 0.000000 3 scene 0.0 0.879367 0.000000 […]

Как добавить строку, наилучшую для рассеивания графика

В настоящее время я работаю с Pandas и matplotlib, чтобы выполнить некоторую визуализацию данных, и я хочу добавить строку, наиболее подходящую для моего разброса. Вот мой код: import matplotlib import matplotlib.pyplot as plt import pandas as panda import numpy as np def PCA_scatter(filename): matplotlib.style.use('ggplot') data = panda.read_csv(filename) data_reduced = data[['2005', '2015']] data_reduced.plot(kind='scatter', x='2005', y='2015') plt.show() […]

Ранг по заполнителю столбцов

Я хочу создать столбец manager_rank который ранжирует менеджера по sum возвратов. Я придумал одно решение, размещенное ниже, но надеялся, что если у кого-то есть что-то более элегантное. import pandas as pd df = pd.DataFrame([['2012', 'A', 1], ['2012', 'B', 4], ['2011', 'A', 5], ['2011', 'B', 4]], columns=['year', 'manager', 'return']) Желаемый результат: year manager return manager_rank 0 […]

Python - лучший язык программирования в мире.