Tag: pandas

pandas Series to Dataframe, используйте индексы Series в качестве столбцов

У меня есть серия, вот так: series = pd.Series({'a': 1, 'b': 2, 'c': 3}) Я хочу преобразовать его в dataframe следующим образом: abc 0 1 2 3 pd.Series.to_frame не работает, он получил результат, 0 a 1 b 2 c 3 Как построить DataFrame из серии с индексом Series в виде столбцов?

Как отсортировать индексированный фрейм данных

В отличие от набора данных pandas на основе списка , у меня есть индексированный dataframe, как это: $ echo -e 'abc\txyz\t0.9\nefg\txyz\t0.3\nlmn\topq\t0.23\nabc\tjkl\t0.5\n' > test.txt $ cat test.txt abc xyz 0.9 efg xyz 0.3 lmn opq 0.23 abc jkl 0.5 $ python >>> import pandas as pd >>> df = pd.read_csv('test.txt', delimiter='\t', header=None, dtype={0:unicode, 1:unicode, 2:float}) >>> […]

pandas: выберите все строки, соответствующие нескольким условиям

У меня есть следующий фреймворк: >>> df = pd.DataFrame({'col1': [1, 2, 1], 'col2': [6, 3, 6]}) >>> df col1 col2 0 1 6 1 2 3 2 1 6 и следующий словарь: >>> di = {'col1': 1, 'col2': 6} >>> di {'col2': 6, 'col1': 1} Я ищу решение, которое будет проходить через di и найти […]

Сглаживание меток (мягкие мишени) в Pandas

В Pandas существует метод get_dummies котором одна горячая кодирует категориальную переменную. Теперь я хочу сделать сглаживание меток, как описано в разделе 7.5.1 книги Deep Learning : Сглаживание меток упорядочивает модель, основанную на softmax с k выходными значениями, заменяя жесткие 0 и 1 целевые показатели мишеней eps / k и 1 – (k – 1) / […]

Передача данных панд в класс

Я хотел бы создать класс из кадра данных pandas, который создается из csv. Это лучший способ сделать это, используя метод @static? так что мне не нужно читать в dataframe отдельно для каждого объекта

Как подсчитать количество вхождений в любом из двух столбцов

У меня простая проблема. У меня есть dataframe df с двумя столбцами. Для каждой из строк, которые встречаются в любом из этих столбцов, я хотел бы подсчитать количество строк, которые имеют символ в любом столбце. Например gk ah ci je di ih bb dd ia dh Следующий код работает, но очень неэффективен. for elem in […]

Как создать новые столбцы для хранения данных столбца дублирующегося идентификатора?

У меня есть этот фреймворк: ID key 0 1 A 1 1 B 2 2 C 3 3 D 4 3 E 5 3 E Я хочу создать дополнительные key столбцы – необходимо – сохранить данные в столбце key когда есть дубликаты IDs Это фрагмент вывода: ID key key2 0 1 AB # Note: ID#1 […]

python pandas countifs с использованием нескольких критериев и нескольких кадров данных

Попытка создания – в Python с использованием нескольких фреймов данных – эквивалент countif в Excel, который охватывает несколько листов. Мне нужно новое количество столбцов записей в другом кадре данных на основе критериев из текущего кадра данных . См. Excel, что я хочу делать в python, также здесь . Моя цель? Подсчет экзаменов по кадрам студентов […]

Как сопоставить сегодняшнюю дату в фрейме данных и отправлять сообщения электронной почты

Я изучаю, как использовать панды для работы с данными, и я нахожу это довольно крутым и забавным. Я пытаюсь создать автоматическую систему электронной почты. Но теперь у меня есть следующее: этот вопрос ссылается на один из моих старых вопросов здесь . Вот как может выглядеть набор данных: Я хочу проверить, является ли datatime_from сегодня, и […]

Python: выборка данных в записях даты и времени

Мои данные выглядят так: 900324492 900405679 900472531 1 2017-04-03 08:04:09 2017-04-03 07:49:53 2017-04-03 07:52:39 2 2017-04-03 08:05:36 2017-04-03 07:54:36 2017-04-03 07:52:19 3 2017-04-03 08:05:28 2017-04-03 07:43:00 2017-04-03 07:50:52 4 2017-04-03 08:06:05 2017-04-03 07:49:42 2017-04-03 07:53:55 Итак, для каждого столбца у меня есть набор временных меток (точнее, объектов datetime). Мне нравится создавать график рассеяния, где x […]

Python - лучший язык программирования в мире.