Tag: pandas

Pandas timeseries plot задает основные и второстепенные тики и метки x-axis

Я хочу иметь возможность установить основные и младшие xticks и их метки для графика временных рядов, построенного из объекта временного ряда Pandas. На странице «Что нового» Pandas 0.9 говорится: «вы можете использовать to_pydatetime или зарегистрировать конвертер для типа Timestamp» но я не могу понять, как это сделать, чтобы использовать команды matplotlib ax.xaxis.set_major_locator и ax.xaxis.set_major_formatter (и […]

Значение истины серии неоднозначно. Используйте команды a.empty, a.bool (), a.item (), a.any () или a.all ()

Возникла проблема фильтрации моего результирующего фрейма с условием или. Я хочу, чтобы мой результат df извлекал все значения столбца var , которые выше 0,25 и ниже -0,25. Эта логика ниже дает мне двусмысленное значение истины, однако оно работает, когда я разделяю эту фильтрацию в двух отдельных операциях. Что здесь происходит? не знаете, где использовать предлагаемые […]

Каков самый быстрый способ загрузить большой файл csv в блокнот для работы с pandon pandas?

Я пытаюсь загрузить файл csv, который составляет 250 МБ. В основном 4 миллиона строк и 6 столбцов данных временных рядов (1 мин). Обычная процедура: location = r'C:\Users\Name\Folder_1\Folder_2\file.csv' df = pd.read_csv(location) Эта процедура занимает около 20 минут !!!. Очень предварительный я изучил следующие варианты Загрузите куски, а затем соедините куски. HDF5 'перо' 'соленый огурец' Интересно, сравнивал […]

NumPy или Pandas: сохранение типа массива как целого с использованием значения NaN

Есть ли предпочтительный способ сохранить тип данных массива numpy фиксированным как int (или int64 или что-то еще), при этом все еще есть элемент внутри, указанный как numpy.NaN ? В частности, я преобразовываю внутреннюю структуру данных в Pandas DataFrame. В нашей структуре у нас есть столбцы целочисленного типа, которые все еще имеют NaN (но dtype столбца […]

Pandas to_html () обрезает содержимое строки

У меня есть объект Python DataFrame Python, содержащий текстовые данные. Моя проблема заключается в том, что когда я использую to_html() , она обрезает строки в выводе. Например: import pandas df = pandas.DataFrame({'text': ['Lorem ipsum dolor sit amet, consectetur adipiscing elit.']}) print (df.to_html()) Выход усекается при adapis… <table border="1" class="dataframe"> <thead> <tr style="text-align: right;"> <th></th> <th>text</th> […]

Удаление строки DataFrame в Pandas на основе значения столбца

У меня есть следующий DataFrame: daysago line_race rating rw wrating line_date 2007-03-31 62 11 56 1.000000 56.000000 2007-03-10 83 11 67 1.000000 67.000000 2007-02-10 111 9 66 1.000000 66.000000 2007-01-13 139 10 83 0.880678 73.096278 2006-12-23 160 10 88 0.793033 69.786942 2006-11-09 204 9 52 0.636655 33.106077 2006-10-22 222 8 66 0.581946 38.408408 2006-09-29 245 […]

Удалите строки с повторяющимися индексами (Pandas DataFrame и TimeSeries)

Я читаю некоторые автоматические метеорологические данные из Интернета. Наблюдения происходят каждые 5 минут и собираются в ежемесячные файлы для каждой метеостанции. Когда я закончил разбор файла, DataFrame выглядит примерно так: Sta Precip1hr Precip5min Temp DewPnt WindSpd WindDir AtmPress Date 2001-01-01 00:00:00 KPDX 0 0 4 3 0 0 30.31 2001-01-01 00:05:00 KPDX 0 0 4 […]

декартовой продукции в пандах

У меня есть два кадра данных панд: from pandas import DataFrame df1 = DataFrame({'col1':[1,2],'col2':[3,4]}) df2 = DataFrame({'col3':[5,6]}) Какова наилучшая практика для получения их декартова продукта (разумеется, не написав его явно как я)? #df1, df2 cartesian product df_cartesian = DataFrame({'col1':[1,2,1,2],'col2':[3,4,3,4],'col3':[5,5,6,6]})

возможно ли слияние пустых нечетких совпадений с python pandas?

У меня есть два DataFrames, которые я хочу объединить на основе столбца. Однако из-за чередующихся написаний, разного количества пробелов, отсутствия / наличия диакритических знаков, я хотел бы иметь возможность сливаться, если они похожи друг на друга. Будет реализован любой алгоритм подобия (soundex, Levenshtein, difflib's). Скажем, один DataFrame имеет следующие данные: df1 = DataFrame([[1],[2],[3],[4],[5]], index=['one','two','three','four','five'], columns=['number']) […]

Как изменить порядок столбцов DataFrame?

У меня есть следующий DataFrame ( df ): import numpy as np import pandas as pd df = pd.DataFrame(np.random.rand(10, 5)) Я добавляю больше столбцов (ов) по заданию: df['mean'] = df.mean(1) Как перенести значение столбца на фронт, т. Е. Установить его как первый столбец, оставляя порядок остальных столбцов нетронутым?

Interesting Posts

Изменение глобальной переменной с тем же именем, что и локальная переменная

Как получить членов Enum в глобальное пространство имен?

Сохраните файл numpy.ndarray в качестве изображения, а затем сохраните значения пикселей

Загрузка всех модулей в папку на Python

Проверьте, произошло ли изменение в re.sub

Python Поиск индекса максимального числа в списке

Получить случайное логическое значение в python?

Имеет ли смысл использовать как countvectorizer, так и tfidfvectorizer в качестве векторов объектов для кластеризации текста с помощью KMeans?

python ast.literal_eval и datetime

Извлечение части данных из файла JSON с помощью python

Минимальный рабочий пример для документации пакета с использованием Sphinx в Python

передача аргументов динамической форме в django

В чем разница между статическим методом и методом класса в Python?

Подключение к базе данных Filemaker с использованием JDBC, Python и JayDeBeApi

Python Mechanize: как выбрать раскрывающийся список, когда два имеют одинаковое имя на веб-странице?

Python - лучший язык программирования в мире.