Tag: pandas

Сохранить фигуру pivottablejs для файла

Я начал использовать пакет pivottablejs для манипулирования и визуализации сводных таблиц в python. from pivottablejs import pivot_ui pivot_ui(df) # where df is a pandas dataframe создаст интерактивную сводную таблицу / сюжет в ноутбуке jupyter. Есть ли какой-нибудь pythonic способ сохранить фигуры, созданные этим пакетом, чтобы (скажем) png из jupyter-ноутбука? Я ищу что-то похожее на классический […]

разрезание pandas multiindex с использованием типа данных datetime

Я новичок в pandas (ver 0.14.0) и столкнулся со следующей проблемой: Я пытаюсь разрезать кадр данных pandas, используя multiindex. Индекс содержит метку времени. Если нарезка использует только дату для метки времени, она отлично работает. При нарезке с использованием времени в метке времени он ничего не возвращает или исключение. Каким образом можно нарезать временную метку, которая […]

Изменение временной частоты в Pandas Dataframe

У меня есть Pandas DataFrame, как показано ниже. df AB date_time 2014-07-01 06:03:59.614000 62.1250 NaN 2014-07-01 06:03:59.692000 62.2500 NaN 2014-07-01 06:13:34.524000 62.2500 241.0625 2014-07-01 06:13:34.602000 62.2500 241.5000 2014-07-01 06:15:05.399000 62.2500 241.3750 2014-07-01 06:15:05.399000 62.2500 241.2500 2014-07-01 06:15:42.004000 62.2375 241.2500 2014-07-01 06:15:42.082000 62.2375 241.3750 2014-07-01 06:15:42.082000 62.2375 240.2500 Я хочу изменить частоту этого на регулярные интервалы […]

Применение строковых функций к элементам, которые могут быть NaN

У меня есть Pandas DataFrame с категориальными данными, написанными людьми. Скажем так: >>> df = pd.DataFrame({'name': ["A", " A", "A ", "b", "B"]}) name 0 A 1 A 2 A 3 b 4 B Я хочу нормализовать эти значения, сняв пробелы и верхняя часть их. Это отлично работает: >>> df.apply(lambda x: x['name'].upper().strip(), axis=1) 0 A […]

python pandas datetime.time – datetime.time

У меня есть dataframe, который содержит два столбца элементов datetime.time. что-то вроде col1 col2 02:10:00.008209 02:08:38.053145 02:10:00.567054 02:08:38.053145 02:10:00.609842 02:08:38.053145 02:10:00.728153 02:08:38.053145 02:10:02.394408 02:08:38.053145 как я могу создать col3, который является различием между col1 и col2? (желательно в микросекундах)? Я искал вокруг, но я не могу найти решение здесь. Кто-нибудь знает? Благодаря!

Pandas – KeyError: ' не в индексе' при обучении модели Keras

Я пытаюсь подготовить модель Keras на основе частичных функций из моего набора данных. Я загрузил набор данных и извлек такие функции: train_data = pd.read_csv('../input/data.csv') X = train_data.iloc[:, 0:30] Y = train_data.iloc[:,30] # Code for selecting the important features automatically (removed) … # Selectintg important features 14,17,12,11,10,16,18,4,9,3 X = train_data.reindex(columns=['V14','V17','V12','V11','V10','V16','V18','V4','V9','V3']) print(X.shape[1]) # -> 10 Но когда […]

Как указать dtype при использовании pandas.read_csv для загрузки данных из файлов csv?

У меня есть текстовые файлы со следующим форматом: 000423|东阿阿胶| 300|1|0.15000| | 000425|徐工机械| 600|1|0.15000| | 000503|海虹控股| 400|1|0.15000| | 000522|白云山A| |2| | 1982.080| 000527|美的电器| 900|1|0.15000| | 000528|柳 工| 300|1|0.15000| | когда я использую read_csv для загрузки их в DataFrame, он не генерирует правильный тип dtype для некоторых столбцов. Например, первый столбец анализируется как int, а не unicode […]

Изменение данных в фрейме данных с иерархической индексацией

Как я могу изменить каждый элемент в DataFrame с иерархической индексацией? Например, возможно, я хочу преобразовать строки в float: from pandas import DataFrame f = DataFrame({'a': ['1,000','2,000','3,000'], 'b': ['2,000','3,000','4,000']}) f.columns = [['level1', 'level1'],['item1', 'item2']] f Out[152]: level1 item1 item2 0 1,000 2,000 1 2,000 3,000 2 3,000 4,000 Я попробовал это: def clean(group): group = […]

договор pandas.DataFrame.equals

У меня есть простой тестовый пример функции, которая возвращает df, который потенциально может содержать NaN. Я тестировал, были ли выходные и ожидаемые результаты равными. >>> output Out[1]: rt ts tt ttct 0 2048 30 0 90 1 1 4096 90 1 30 1 2 0 70 2 65 1 [3 rows x 5 columns] >>> […]

Pandas удалить столбец по индексу

Предположим, что у меня есть DataFrame: >>> df = pd.DataFrame([[1,2,3], [4,5,6], [7,8,9]], columns=['a','b','b']) >>> df abb 0 1 2 3 1 4 5 6 2 7 8 9 И я хочу удалить второй столбец 'b' . Если я просто использую оператор del , он удалит оба столбца 'b' : >>> del df['b'] >>> df a […]

Python - лучший язык программирования в мире.