Tag: pandas

Есть ли способ передать разные вертикальные линии каждому подзаговору при использовании гистограммы панды с помощью «by = somevar»?

Я делаю гистограммы с помощью панд, и я считаю этот подход удобным. Например, если я это сделаю: DF [ 'plotvar']. Hist (по = 'Зона') я получил Но теперь я хочу добавить 95% ДИ в каждую из этих подгрупп, и, конечно, интервалы разные для каждой группы. Я мог бы сделать это, просто используя plt.axvline в matplotlib, […]

Pandas 0.20.2 to_sql () с использованием MySQL

Я пытаюсь написать dataframe в таблицу MySQL, но получаю (111 Connection refused) об ошибке (111 Connection refused) . Я выполнил принятый ответ здесь: Запись в базу данных MySQL с помощью pandas с использованием SQLAlchemy, to_sql Код ответа: import pandas as pd import mysql.connector from sqlalchemy import create_engine engine = create_engine('mysql+mysqlconnector://[user]:[pass]@[host]:[port]/[schema]', echo=False) data.to_sql(name='sample_table2', con=engine, if_exists = […]

Объединение нескольких кадров данных pandas в единый блок данных с конкатенацией содержимого в виде списка

У меня есть словарь с неизвестным количеством блоков данных pandas. Каждый файл данных содержит набор столбцов, которые всегда присутствуют (user_id), и набор столбцов, которые могут быть или не быть. Все данные имеют одинаковое количество и порядок строк. Содержимое каждой ячейки – это список (для интересующих столбцов). Упрощенный пример: df['first'] = pd.DataFrame( {'user_ID': [1, 2, 3], […]

Pandas обновляет выходные дни до ближайшего рабочего дня

У меня есть DataFrame, который в настоящее время выглядит следующим образом: raw_data = {'AllDate':['2017-04-05','2017-04-06','2017-04-07','2017-04-08','2017-04-09']} import pandas as pd df = pd.DataFrame(raw_data,columns=['AllDate']) print df Я хотел бы добавить столбец WeekDate в этот файл данных, например, если дата в «AllDate» выпадает на выходные, столбец «WeekDate» имеет дату с пятницы до этого. Если дата выпадает на день недели, […]

Вычитание между различными значениями типа данных в python

У меня есть DataFrame, который выглядит так: raw_data = {'Series_Date':['2017-03-10','2017-03-13','2017-03-14','2017-03-15'],'SeriesDate':['2017-03-10','2017-03-13','2017-03-14','2017-03-15']} import pandas as pd df = pd.DataFrame(raw_data,columns=['Series_Date','SeriesDate']) print df Однако при запуске следующих команд: from pandas.tseries.offsets import BDay df['SeriesDate'] = pd.to_datetime(df['SeriesDate']) df['Start_Date'] = df['SeriesDate'] – BDay(10) Я получаю следующую ошибку: TypeError: ufunc subtract cannot use operands with types dtype('<M8[ns]') and dtype('O') Как я могу обойти […]

Отбросить столбец, который является подмножеством любого другого столбца в фрейме данных

У меня есть рамка данных pandas, как показано ниже. Как я могу удалить любой столбец, который является подмножеством любого из оставшихся столбцов? Я бы хотел сделать это без использования fillna. df = pd.DataFrame([ [1,1,3,3], [np.NaN,2,np.NaN,4]], columns=['A','B','C','D'] ) df ABCD 0 1.0 1 3.0 3 1 NaN 2 NaN 4 Я могу определить здесь, что столбец […]

Посмотрите и замените значения в списке (pandas)

У меня есть список z = ['111111','222222','333333','4444444'] и я хочу искать каждый элемент в z и заменять его эквивалентным значением, хранящимся в моих данных dataframe, который имеет два столбца, старые числа и новые числа: old_numbers = data.ix[i, 'old_ids'] new_numbers = data.ix[i, 'new_ids'] Пример: старый номер 111111 в z должен быть обновлен до 121212, а 222222 […]

Односторонний t-тест для линейной регрессии?

У меня проблемы с этим. Я пытаюсь сделать линейную регрессию и проверить наклон. Т-тест проверяет, находится ли уклон далеко от 0. Наклон может быть отрицательным или положительным. Меня интересуют только негативные склоны. В этом примере наклон положителен, что меня не интересует, поэтому значение P должно быть большим. Но это мало, потому что сейчас он проверяет, […]

Как слить столбец коллекции с помощью Python Pandas?

У меня есть 2 списка вопросов переполнения стека, группа A и группа B. Оба имеют два столбца: Id и Tag. например: |Id |Tag | ——– | ——————————————– |2 |c#,winforms,type-conversion,decimal,opacity Для каждого вопроса в группе A мне нужно найти в группе B все совпадающие вопросы, которые имеют по крайней мере один перекрывающий тег вопрос в группе […]

Может ли pandas SparseSeries хранить значения в формате float16?

Причина, по которой я хочу использовать меньший тип данных в разреженных контейнерах pandas, заключается в сокращении использования памяти. Это актуально при работе с данными, изначально использующими bool (например, to_dummies ) или небольшими числовыми типами данных (например, int8), которые все преобразованы в float64 в разреженных контейнерах. Создание DataFrame В приведенном примере используется скромный 20k x 145 […]

Interesting Posts

Как сопоставить функцию в пандах, которая сравнивает каждую запись в столбце с предыдущими и последующими записями

RESTFUL веб-сервисы, используемые веб-и родными мобильными приложениями с аутентификацией на python с использованием платформы django

Иерархия в matplotlib

Тайм-аут при вызове IPython embed ()

Tkinter. После окна замораживания метода?

Фильтр высоких частот Python

Qt – слот подключения с аргументом, использующий лямбда

Функция Split add: \ xef \ xbb \ xbf … \ n в мой список

Проблема при импорте LoginManager из flask.ext.login

Регулярное выражение для извлечения URL из HTML-ссылки

Любой простой способ построить 3D-разброс в Python, с которым я могу вращаться?

Запуск скрипта python с помощью cron, если он не запущен

Легкий способ запуска скриптов Python с помощью мыши в OS-X

Разбор html-данных в список python для манипуляции

Удаление элемента из списка – во время итерации – что случилось с этой идиомой?

Python - лучший язык программирования в мире.