Tag: pandas

Как преобразовать последние несколько столбцов в целое число из строкового типа в пандах

У меня есть df, называемый df . Я хочу преобразовать последние 10 столбцов этого фрейма данных из строкового типа в целые числа. Как я могу сделать это с питоническим путем?

Boxplot и groupby: проблема с группами и sharex

Вот мои наборы данных: df ABC 0 13 Yes False 1 12 No True 2 2 Yes True 3 12 No False 4 4 No True 5 1 Yes True 6 1 No False 7 5 No True 8 15 Yes False а также df2 ABC 0 13 Yes False 1 12 No False 2 […]

Получить имена строк и столбцов (argmax) для максимальной записи в кадре данных pandas

df.idxmax () возвращает max вдоль оси (строка или столбцы), но я хочу arg_max (df) по полному файловому кадру, который возвращает кортеж (строка, столбец). Вариант использования, который я имею в виду, – это выбор функции, в котором у меня есть корреляционная матрица и вы хотите «рекурсивно» удалить функции с самой высокой корреляцией. Я препроцессу корреляционной матрицы, […]

Как определить область для построения графика в Pandas?

Теперь я пытаюсь построить dataframe by Pandas. Все хорошо, но я не знаю, как определить оси y и оси x. Например, в следующем, я хочу показать график от 1,0 до 0,0 по шкале оси Y вместо 0.0 до 0.7. Вот код для приведенного выше графика. In [90]: df Out[90]: history lit science social accuracy 2014-11-18 […]

Новый столбец с именем столбца от максимального столбца по индексам pandas

Я хочу создать новый столбец с именем столбца для максимального значения по индексу. Галстук будет включать обе колонки. ABCD TRDNumber ALB2008081610 3 1 1 1 ALB200808167 1 3 4 1 ALB200808168 3 1 3 1 ALB200808171 2 2 5 1 ALB2008081710 1 2 2 5 Желаемый выход ABCD Best TRDNumber ALB2008081610 3 1 1 1 […]

заставить панды читать нан как струну

Я не мог найти другого вопроса, связанного с моим. Пожалуйста, помогите мне со ссылкой, если я пропустил это … У меня есть csv-файл, похожий на это: "concentration" "5" "5" "5" "5" "5" "nan" "nan" "nan" "nan" "nan" Если я прочитал его с помощью pandas read_csv, значения «nan» автоматически интерпретируются как NaN. Но я хотел бы […]

Использование pandas pd.cut для генерации категориальной переменной с помощью statsmodels

Я попытался использовать pd.cut для создания категориальной переменной из непрерывной переменной. Я бы хотел использовать это в последующей статистической регрессии, включая эту фиктивную переменную. Когда я создаю категориальную переменную, созданную таким образом, я получаю сообщение об ошибке TypeError: data type not understood. Пример теста приведен ниже. import numpy as np import pandas as pd import […]

Pandas: Как индексировать строки?

У меня есть такой набор данных: stock_symbol stock_date stock_price_open stock_price_high QRR 8/2/10 2.37 2.42 2.29 QTM 5/2/10 2.38 2.5 2.34 QXM 4/2/10 2.57 2.64 2.39 Я прочитал набор данных NYSE: df = pandas.read_csv('NYSE.csv', index_col = 0, parse_dates=True) Когда я запускал: df[['QRR','QTM','QXM']] Я получил эту ошибку: KeyError: "['QRR' 'QTM' 'QXM'] not in index" «QRR», «QTM», «QXM» […]

Поиск самой древовидной иерархии, которая объясняет данные

Рассмотрим следующий блок данных: ABC 1 A1 B1 C1 2 A2 B2 C2 3 A3 B1 C1 4 A1 B1 C2 5 A2 B1 C1 6 A1 B4 C2 где A , B и C представляют атрибуты. Я надеюсь вывести наиболее вероятную иерархическую структуру между A , B и C Под этим я подразумеваю поиск […]

Прочитайте иерархический (древовидный) XML в рамку данных pandas, сохраняя иерархию

У меня есть документ XML, который содержит иерархическую древовидную структуру, см. Пример ниже. Документ содержит несколько тегов <Message> (я только скопировал один из них для удобства). Каждое <Message> имеет некоторые связанные данные ( id , status , priority ) самостоятельно. Кроме того, каждый <Message> может содержать один или несколько дочерних <Street> которые снова имеют некоторые […]

Interesting Posts for Van-Lav
Python - лучший язык программирования в мире.