Tag: pandas

Как я могу написать горячую кодировку в Python?

У меня проблема классификации машинного обучения с 80% -ными категориальными переменными. Должен ли я использовать одну горячую кодировку, если я хочу использовать некоторый классификатор для классификации? Могу ли я передать данные в классификатор без кодировки? Я пытаюсь сделать следующее для выбора функции: Я прочитал файл поезда: num_rows_to_read = 10000 train_small = pd.read_csv("../../dataset/train.csv", nrows=num_rows_to_read) Я изменяю […]

Напротив расплава в пандах python

Я не могу понять, как сделать «обратный расплав», используя Pandas в python. Это мои исходные данные import pandas as pd from StringIO import StringIO origin = pd.read_table(StringIO('''label type value xa 1 xb 2 xc 3 ya 4 yb 5 yc 6 za 7 zb 8 zc 9''')) origin Out[5]: label type value 0 xa 1 […]

Опция отказоустойчивого окна в OLS от Pandas до Statsmodels

как указано в названии, где опция подвижной функции в команде ols в Pandas мигрировала в statsmodels? Кажется, я не могу найти его. Пандас говорит мне, что гибель в работе: FutureWarning: The pandas.stats.ols module is deprecated and will be removed in a future version. We refer to external packages like statsmodels, see some examples here: http://statsmodels.sourceforge.net/stable/regression.html […]

Нормализация панд DataFrame по строке

Каков самый идиоматический способ нормализации каждой строки pandas DataFrame? Нормализация столбцов проста, поэтому один (очень уродливый!) Вариант: (df.T / df.T.sum()).T Правила вещания Pandas предотвращают выполнение df / df.sum(axis=1)

Вычисление разницы между двумя строками в Python / Pandas

В python, как я могу ссылаться на предыдущую строку и вычислять что-то против нее? В частности, я работаю с dataframes в pandas – у меня есть кадр данных, полный информации о ценах на акции, который выглядит так: Date Close Adj Close 251 2011-01-03 147.48 143.25 250 2011-01-04 147.64 143.41 249 2011-01-05 147.05 142.83 248 2011-01-06 […]

Получить последний столбец после операции .str.split () в столбце в pandas DataFrame

У меня есть столбец DataFrame pandas, который я хотел бы разделить на одно пространство. Расщепление достаточно просто с DataFrame.str.split(' ') , но я не могу создать новый столбец из последней записи. Когда я .str.split() в столбце, я получаю список массивов, и я не знаю, как это сделать, чтобы получить новый столбец для моего DataFrame. Вот […]

читать csv-файл и возвращать data.frame в Python

У меня есть CSV-файл, "value.txt" со следующим содержимым: первые несколько строк файла: Date,"price","factor_1","factor_2" 2012-06-11,1600.20,1.255,1.548 2012-06-12,1610.02,1.258,1.554 2012-06-13,1618.07,1.249,1.552 2012-06-14,1624.40,1.253,1.556 2012-06-15,1626.15,1.258,1.552 2012-06-16,1626.15,1.263,1.558 2012-06-17,1626.15,1.264,1.572 В R мы можем прочитать этот файл при использовании price <- read.csv("value.txt") и это вернет data.frame, который я могу использовать для статистических операций: > price <- read.csv("value.txt") > price Date price factor_1 factor_2 1 2012-06-11 […]

Как переформатировать блок данных с различными функциями, применяемыми к каждому столбцу?

У меня есть временная серия с температурой и излучением в dataframe панд. Временное разрешение составляет 1 минуту в обычных шагах. import datetime import pandas as pd import numpy as np date_times = pd.date_range(datetime.datetime(2012, 4, 5, 8, 0), datetime.datetime(2012, 4, 5, 12, 0), freq='1min') tamb = np.random.sample(date_times.size) * 10.0 radiation = np.random.sample(date_times.size) * 10.0 frame = […]

Результаты расчета Pandas GroupBy

Я начинаю изучать Pandas и пытаюсь найти большинство способов Pythonic (или panda-thonic?) Для выполнения определенных задач. Предположим, что у нас есть DataFrame со столбцами A, B и C. Столбец A содержит логические значения: значение каждой строки A равно true или false. Столбец B имеет некоторые важные значения, которые мы хотим построить. То, что мы хотим […]

Объединение двух серий в DataFrame в пандах

У меня есть две серии s1 и s2 с теми же (не последовательными) индексами. Как объединить s1 и s2 в два столбца в DataFrame и сохранить один из индексов в качестве третьего столбца?

 
Interesting Posts for Van-Lav

Преобразование даты строки в метку времени в Python

Почему разные методы одного и того же объекта имеют один и тот же идентификатор?

Несколько уровней «collection.defaultdict» в Python

Tensorflow – литье из int, чтобы плавать странное поведение

Сообщение об ошибке Python в PyCharm: невозможно подключиться к сегменту разделяемой памяти

Скрыть вывод stderr в модульных тестах

pcapy.findalldevs () Нет действительных интерфейсов для открытия

Как изящно справиться с неудачной функцией будущего (__future__) импорта из-за старой версии интерпретатора?

Перемещение радиальных меток на полярном участке в matplotlib

Преобразование Python в int int

Можно ли запретить Django создавать файлы .pyc во время разработки?

как следить за обновлениями мета в Python

Ошибка загрузки ctypes Python: неопределенный символ

Что такое хорошая практика Python для импорта и предоставления дополнительных функций?

Эквивалент GetTickCount () для Linux

Python - лучший язык программирования в мире.