Tag: pandas

Линейная регрессия – уменьшает степень свободы

У меня есть кадр данных Pandas с такими столбцами, как Order Balance Profit cum (%) Я делаю линейную регрессию model_profit_tr = pd.ols(y=df_closed['Profit cum (%)'], x=df_closed['Order']) Проблема в том, что стандартная модель похожа (уравнение линии, которая не проходит через начало координат) y = a * x + b Существует 2 степени свободы (a и b) наклон […]

Преобразование разреженной матрицы (csc_matrix) в pandas dataframe

Я хочу преобразовать эту матрицу в рамку данных pandas. csc_matrix Первое число в скобке должно быть индексом , второе – столбцами, а число в конце – данными . Я хочу сделать это, чтобы сделать выбор функции в текстовом анализе, первое число представляет собой документ, второе – признаком слова, а последнее число – счетом TFIDF. Получение […]

Pandas, DataFrame: разделение одного столбца на несколько столбцов

У меня есть следующий DataFrame. Мне интересно, можно ли разбить столбец данных на несколько столбцов. Например, из этого: ID Дата данных 6 21/05/2016 A: 7, B: 8, C: 5, D: 5, A: 8 6 21/01/2014 B: 5, C: 5, D: 7 6 02/04/2013 A: 4, D: 7 7 05/06/2014 C: 25 7 12/08/2014 D: 20 […]

Как хранить массивы numpy в столбце блока данных Pandas?

Можно ли хранить произвольные массивы numpy в качестве значений одного столбца в кадре данных Pandas ? Массивы все двумерные, и я намереваюсь использовать их для вычисления значений для других столбцов в одном и том же фрейме. Чтобы обеспечить некоторый контекст того, что я пытаюсь сделать здесь: Каждый массив является матрицей смежности некоторой сети, и для […]

Поиск в Pandas, сопоставление одного столбца в кадре данных с другим в другой части данных

У меня есть два кадра данных pandas: df1 и df2. df1 имеет столбцы X и Y и weeknum. df2 имеет столбцы Z, weeknum и datetime. Я хочу в основном сохранить df1 и добавить в него дополнительный столбец, соответствующий datetime для weeknum. Я могу использовать слияние, но должен быть более чистый способ, не отбрасывая столбец Z.

Панды: проблемы с пониманием того, как работает слияние

Я делаю что-то не так с слиянием, и я не понимаю, что это такое. Для оценки гистограммы ряда целочисленных значений я сделал следующее: import pandas as pnd import numpy as np series = pnd.Series(np.random.poisson(5, size = 100)) tmp = {"series" : series, "count" : np.ones(len(series))} hist = pnd.DataFrame(tmp).groupby("series").sum() freq = (hist / hist.sum()).rename(columns = {"count" […]

SQL как объединения в пандах

У меня есть два фрейма данных, первый из которых имеет форму (обратите внимание, что даты являются объектами datetime): df = DataFrame('key': [0,1,2,3,4,5], 'date': [date0,date1, date2, date3, date4, date5], 'value': [0,10,20,30,40,50]) И вторая, которая имеет вид: df2 = DataFrame('key': [0,1,2,3,4,5], 'valid_from': [date0, date0, date0, date3, date3, date3], 'valid_to': [date2, date2, date2, date5, date5, date5], 'value': [0, […]

Удалить группу после группы pandas groupby

Можно ли удалить группу (по имени группы) из объекта groupby в пандах? То есть, после выполнения groupby, удалите полученную группу на основе ее имени.

Объединение двух временных рядов в пандах

Извиняюсь, если это где-то где-то где-то документировано, но мне трудно обнаружить его. У меня есть два TimeSeries с некоторыми перекрывающимися датами / индексами, и я бы хотел их объединить. Я предполагаю, что мне нужно будет указать, какая из двух серий принимает значения из для перекрывающихся дат. Для иллюстрации у меня есть: s1: 2008-09-15 100 2008-10-15 […]

От кортежей до нескольких столбцов в пандах

Как преобразовать этот фрейм данных значение местоположения 0 (Ричмонд, Вирджиния, Нан, США) 100 1 (Нью-Йорк, Нью-Йорк, нан, США) 200 к этому: городская область 0 Richmond Virginia nan США 100 1 Нью-Йорк Нью-Йорк, США, США 200 Обратите внимание, что столбец location в первом фрейме данных содержит кортежи. Я хочу создать четыре столбца из столбца location .

 
Interesting Posts for Van-Lav

Какой самый безопасный способ удаления файлов фреймворка Python, расположенных в разных местах, чем установка Brew

ОШИБКА: не удалось получить доступ к файлу «$ libdir / plpython2»: нет такого файла или каталога

Индексы списка Python и JSON – TypeError должны быть целыми, а не str

Как взять максимум 2 столбца в фрейме данных и сделать его еще одним столбцом?

pySerial write () отлично работает в интерпретаторе Python, но не в скрипте Python

Mac OS X + Python + Django + MySQL

Очередь с итерацией Python

Почему я получаю «ResultSet» не имеет атрибута «findAll», используя BeautifulSoup в Python?

рекурсивный доступ к словарю и модификация

Как перенести приложение Python в Linux, которое отлично работает в Windows

Преобразование выбранных столбцов в csv в словарь

Pandas, DataFrame: разделение одного столбца на несколько столбцов

как распечатать вывод, возвращаемый функцией в новых строках, используя python?

Остановка потока через определенное время

Функциональность mkdir -p в Python

Python - лучший язык программирования в мире.