Tag: pandas

Unicode Encode Error при записи pandas df в csv

Я очистил 400 файлов excel и прочитал их на python, используя pandas, и добавил все необработанные данные в один большой df. Затем, когда я пытаюсь экспортировать его в csv: df.to_csv("path",header=True,index=False) Я получаю эту ошибку: UnicodeEncodeError: 'ascii' codec can't encode character u'\xc7' in position 20: ordinal not in range(128) Может кто-нибудь предложить способ исправить это и […]

Pandas read_csv ожидает неправильное количество столбцов, с рваным файлом csv

У меня есть файл csv, который содержит несколько сотен строк и 26 столбцов, но последние несколько столбцов имеют только значение в нескольких строках, и они находятся к середине или концу файла. Когда я пытаюсь прочитать его при использовании read_csv (), я получаю следующую ошибку. «ValueError: ожидая 23 столбца, получил 26 в строке 64» Я не […]

Pandas DataFrame Добавить столбец в индекс без сброса

как добавить 'd' в индекс ниже, не перезагружая его первым? from pandas import DataFrame df = DataFrame( {'a': range(6), 'b': range(6), 'c': range(6)} ) df.set_index(['a','b'], inplace=True) df['d'] = range(6) # how do I set index to 'abd' without having to reset it first? df.reset_index(['a','b','d'], inplace=True) df.set_index(['a','b','d'], inplace=True) df

Проблемы с производительностью с пандами и фильтрация в столбце datetime

У меня есть фрейм данных pandas с объектом datetime64 на одном из столбцов. time volume complete closeBid closeAsk openBid openAsk highBid highAsk lowBid lowAsk closeMid 0 2016-08-07 21:00:00+00:00 9 True 0.84734 0.84842 0.84706 0.84814 0.84734 0.84842 0.84706 0.84814 0.84788 1 2016-08-07 21:05:00+00:00 10 True 0.84735 0.84841 0.84752 0.84832 0.84752 0.84846 0.84712 0.8482 0.84788 2 2016-08-07 […]

Как я могу фильтровать pandas DataFrame на основе значений?

Я работаю на Python с пандами DataFrame из видеоигр, каждый из которых имеет жанр. Я пытаюсь удалить любую видеоигру с жанром, который появляется меньше, чем некоторое количество раз в DataFrame, но я не знаю, как это сделать. Я нашел вопрос StackOverflow, который, как представляется, связан, но я не могу расшифровать решение вообще (возможно, потому, что […]

Извлечь значения в Pandas value_counts ()

Скажем, мы использовали dataframe[column].value_counts() pandas dataframe[column].value_counts() который выводит: apple 5 sausage 2 banana 2 cheese 1 Как вы извлекаете значения из этого в порядке, указанном выше, например max-min? [apple,sausage,banana,cheese]

Pandas: не могу написать файл excel

Попробуйте этот пример из документации writer = ExcelWriter('output.xlsx') df1.to_excel(writer,'Sheet1') df2.to_excel(writer,'Sheet2') writer.save() Я узнал, что не могу написать файл excel с ошибкой TypeError: copy() got an unexpected keyword argument 'font' Я использую Panda 0.16 для Mac pro. EDIT: запись в файл xls работает отлично. Я не настаиваю на наличии файла xlsx, просто задаюсь вопросом, почему он […]

Pandas (python): Как добавить столбец в dataframe для индекса?

Индекс, который у меня есть в фрейме данных (с 30 строками), имеет следующий вид: Int64Index([171, 174,173, 172, 199………….. ….175, 200]) Индекс не является строго возрастающим, поскольку кадр данных является результатом сортировки (). Я хочу добавить столбец, который является серией: [1, 2, 3, 4, 5………………….., 30] Как я должен это делать? Благодарю.

Получение min и max Дата из кадра данных pandas

Как получить минимальную и максимальную дату с главной оси данных? value Date 2014-03-13 10000.000 2014-03-21 2000.000 2014-03-27 2000.000 2014-03-17 200.000 2014-03-17 5.000 2014-03-17 70.000 2014-03-21 200.000 2014-03-27 5.000 2014-03-27 25.000 2014-03-31 0.020 2014-03-31 12.000 2014-03-31 0.022 По сути, я хочу, чтобы получить минимальные и максимальные даты, то есть 2014-03-13 и 2014-03-31 . Я попытался использовать […]

Как удалить последнюю строку данных фрейма pandas

Я думаю, что это должно быть просто, но я попробовал несколько идей, и никто из них не работал: last_row = len(DF) DF = DF.drop(DF.index[last_row]) #<– fail! Я пытался использовать отрицательные индексы, но это также приводило к ошибкам. Я все еще должен недопонимать что-то основное. Заранее спасибо.

Python - лучший язык программирования в мире.