Tag: pandas

Pandas read_csv игнорирует столбцы dtypes при передаче skip_footer arg

Когда я пытаюсь импортировать файл csv в панду данных dataframe (0.13.1), игнорируется параметр dtype. Есть ли способ остановить панды от вывода типа данных самостоятельно? Я объединяю несколько файлов CSV, и иногда клиент содержит буквы и импорт панд в виде строки. Когда я пытаюсь объединить два фрейма данных, я получаю сообщение об ошибке, потому что я […]

Изменить выход из Python Pandas

Есть ли способ опустить часть вывода из панд описать? Эта команда дает мне именно то, что я хочу, с выходом таблицы (счет и значение executeTime by simpleDate) df.groupby('simpleDate').executeTime.describe().unstack(1) Однако это все, что я хочу, считаю и имею в виду. Я хочу удалить std, min, max и т. Д. До сих пор я только читал, как […]

Не удалось сбросить индекс Pandas

Я не уверен, где я в заблуждение, но я не могу сбросить индекс на кадре данных. Когда я запускаю test.head() , я получаю следующий результат: Как вы можете видеть, dataframe является срезом, поэтому индекс выходит за пределы. То, что я хотел бы сделать, это сбросить индекс для этого фрейма. Поэтому я запускаю test.reset_index(drop=True) . Это […]

Массовая вставка Pandas DataFrame с использованием SQLAlchemy

У меня есть довольно большие панды DataFrames, и я бы хотел использовать новые массовые сопоставления SQL для загрузки их на Microsoft SQL Server через SQL Alchemy. Метод pandas.to_sql, в то время как хороший, медленный. У меня возникли проблемы с написанием кода … Я хотел бы иметь возможность передать эту функцию pandas DataFrame, которую я называю […]

Как преобразовать список объектов модели в pandas dataframe?

У меня есть массив объектов этого класса class CancerDataEntity(Model): age = columns.Text(primary_key=True) gender = columns.Text(primary_key=True) cancer = columns.Text(primary_key=True) deaths = columns.Integer() … При печати массив выглядит следующим образом: [CancerDataEntity(age=u'80-85+', gender=u'Female', cancer=u'All cancers (C00-97,B21)', deaths=15306), CancerDataEntity(… Я хочу преобразовать это в кадр данных, чтобы я мог играть с ним более подходящим способом для меня – для […]

Как открыть и преобразовать базу данных sqlite в pandas dataframe

Я загрузил некоторые данные в виде базы данных sqlite (data.db), и я хочу открыть эту базу данных в python, а затем преобразовать ее в pandas dataframe. Это до сих пор я сделал import sqlite3 import pandas dat = sqlite3.connect('data.db') #connected to database with out error pandas.DataFrame.from_records(dat, index=None, exclude=None, columns=None, coerce_float=False, nrows=None) Но его выброс этой […]

Серия Pandas Сортировать

У меня есть фрейм данных Pandas, называемый pd , и я извлекаю количество уникальных значений в одном из столбцов этого фрейма данных, используя следующую команду: b = df.groupby('Region').size() b – объект серии Pandas и выглядит так: In [48]: b Out[48]: Region 0 8 1 25 11 1 2 41 3 23 4 15 5 35 […]

Временные ряды Resample в пандах до недельного интервала

Как переделать временные ряды в пандах на недельную частоту, где недели начинаются в произвольный день? Я вижу, что есть необязательная база ключевых слов, но она работает только на интервалы, не превышающие один день.

pandas – groupby и фильтрация для последовательных значений

У меня есть этот dataframe df : U,Datetime 01,2015-01-01 20:00:00 01,2015-02-01 20:05:00 01,2015-04-01 21:00:00 01,2015-05-01 22:00:00 01,2015-07-01 22:05:00 02,2015-08-01 20:00:00 02,2015-09-01 21:00:00 02,2014-01-01 23:00:00 02,2014-02-01 22:05:00 02,2015-01-01 20:00:00 02,2014-03-01 21:00:00 03,2015-10-01 20:00:00 03,2015-11-01 21:00:00 03,2015-12-01 23:00:00 03,2015-01-01 22:05:00 03,2015-02-01 20:00:00 03,2015-05-01 21:00:00 03,2014-01-01 20:00:00 03,2014-02-01 21:00:00 сделанные U и объектом Datetime . То, что я […]

Установите заголовки, используя pandas.read_csv

У меня есть файл csv, который я читал в dataframe с помощью API pandas. Я намерен установить собственный заголовок вместо первой строки по умолчанию. (Я также избавляюсь от некоторых строк.) Как мне лучше всего это достичь? Я попробовал следующее, но это не сработало, как ожидалось: header_row=['col1','col2','col3','col4', 'col1', 'col2'] # note the header has duplicate column […]

Python - лучший язык программирования в мире.