Tag: pandas

Не удается экспортировать фрейм данных pandas в excel / encoding

Я не могу экспортировать один из своих фреймов данных из-за некоторой сложности кодирования. sjM.dtypes Customer Name object Total Sales float64 Sales Rank float64 Visit_Frequency float64 Last_Sale datetime64[ns] dtype: object csv экспорт работает отлично path = 'c:\\test' sjM.to_csv(path + '.csv') # Works но экспорт excel не удается sjM.to_excel(path + '.xls') Traceback (most recent call last): File […]

взрыва нескольких полей csv в python

У меня есть файл excel с 200 строками, 2 из которых имеют значения, разделенные запятыми. Если я выведу их на вкладку, это будет выглядеть так: col1 col2 col3 ab,cd,e fg,hi,j Мне нужно взорваться, чтобы получить такую ​​структуру данных, взрыва 200 строк в ~ 4000: col1 col2 col3 abd abe acd ace fgi fgj fhi fhj […]

Панды: быстро добавьте переменное число месяцев в столбец временной метки

Вот настройка: У меня есть два (целочисленных) столбца, start и month_delta . start имеет отметки времени (его внутренний тип – np.datetime64[ns] ), а month_delta – целые числа. Я хочу быстро создать столбец, состоящий из каждого дня и времени в start , за счет соответствующего количества месяцев в month_delta . Как мне это сделать? Вещи, которые […]

pandas DataFrame – Получение часов в течение продолжительности

Я относительный новичок в пандах, и я не уверен, как подойти к этому. Я анализирую поток билетов через систему справочной системы. Необработанные данные выглядят следующим образом (со многими столбцами, а иногда и в течение нескольких дней): TicketNo SvcGroup CreatedAt ClosedAt 0 4237941 Unix 2013-07-28 03:55:00 2013-07-28 11:01:37.346438 1 4238041 Windows 2013-07-28 04:59:00 2013-07-28 18:25:02.193182 2 […]

Как получить регрессионный перехват с помощью Statsmodels.api

Я пытаюсь вычислить регрессионный вывод, используя библиотеку python, но я не хочу, чтобы получить значение перехвата, когда я использую библиотеку: import statsmodels.api as sm Он печатает весь регрессионный анализ, за ​​исключением перехвата. но когда я использую: from pandas.stats.api import ols Мой код для панд: Regression = ols(y= Sorted_Data3['net_realization_rate'],x = Sorted_Data3[['Cohort_2','Cohort_3']]) print Regression Я получаю перехват […]

Pandas: получать значения индекса и столбцов каждого значения

Я хочу получить имя индекса и столбца каждой ячейки в кадре данных Pandas. Например, в кадре данных, генерируемом из приведенного ниже кода df = pd.DataFrame({1 : np.arange(1, 6), 2 : np.arange(6, 11), 3 : np.arange(11, 16), 4 : np.arange(16, 21), 5 : np.arange(21, 26)}, index=[1, 2, 3, 4, 5]) Я хочу получить доступ к имени […]

Использование Datetimes с Regplot для Seaborn's

Я работаю в Jupyter / IPython, чтобы нарисовать количество слов в день, но у меня возникают проблемы с использованием данных с Regplot в Seaborn. Regplot сам по себе, по-видимому , не поддерживает регрессию против данных даты , хотя то, что я пытаюсь выполнить, не обязательно требует обходного пути для Regplot – возможно, всего лишь способ […]

Как сохранить список в виде CSV-файла с помощью python с новыми строками?

Я хотел бы сохранить список python в .csv файле, например, у меня есть список: ['hello','how','are','you'] Я хотел бы сохранить его следующим образом: colummn, hello, how, are, you, Я попробовал следующее: myfile = open('/Users/user/Projects/list.csv', 'wb') wr = csv.writer(myfile, quoting=csv.QUOTE_ALL,'\n') wr.writerow(pos_score)

Pandas _ metadata ошибки сохранения данных DataFrame

Я, наконец, понял, как использовать _metadata из DataFrame, все работает, за исключением того, что я не могу его сохранить, например, для hdf5 или json. Я знаю, что это работает, потому что я копирую атрибуты frame и _metadata, копируя атрибуты «non_metadata», нет. пример df = pandas.DataFrame #make up a frame to your liking pandas.DataFrame._metadata = ["testmeta"] […]

Прогнозирование будущих значений с использованием регрессии OLS (Python, StatsModels, Pandas)

В настоящее время я пытаюсь реализовать MLR в Python и не знаю, как я использую коэффициенты, которые я нашел для будущих значений. import pandas as pd import statsmodels.formula.api as sm import statsmodels.api as sm2 TV = [230.1, 44.5, 17.2, 151.5, 180.8] Radio = [37.8,39.3,45.9,41.3,10.8] Newspaper = [69.2,45.1,69.3,58.5,58.4] Sales = [22.1, 10.4, 9.3, 18.5,12.9] df = […]

Python - лучший язык программирования в мире.