Tag: pandas

Можно ли вставить строку в произвольную позицию в кадре данных с использованием панд?

У меня есть объект DataFrame, похожий на этот: onset length 1 2.215 1.3 2 23.107 1.3 3 41.815 1.3 4 61.606 1.3 … То, что я хотел бы сделать, это вставить строку в позицию, указанную некоторым значением индекса, и соответственно обновить следующие индексы. Например: onset length 1 2.215 1.3 2 23.107 1.3 3 30.000 1.3 […]

import csv с различным количеством столбцов в строке с использованием Pandas

Каков наилучший подход для импорта CSV, который имеет различное количество столбцов для каждой строки с использованием Pandas или CSV-модуля в Pandas DataFrame. "H","BBB","D","Ajxxx Dxxxs" "R","1","QH","DTR"," "," ","spxxt rixxls, raxxxd","1" Используя этот код: import pandas as pd data = pd.read_csv("smallsample.txt",header = None) возникает следующая ошибка Error tokenizing data. C error: Expected 4 fields in line 2, […]

Как объединить столбец datetime в ближайший квартал

Я загрузил файл данных в фреймворк Pandon pandas. У меня есть столбец datetime в формате 2015-07-18 13:53:33.280 . Мне нужно создать новый столбец, который округляет его до ближайшего квартала. Таким образом, 2015-07-18 13:45:00.000 выше дата будет округлена до 2015-07-18 13:45:00.000 . Как это сделать в пандах? Я попытался использовать решение здесь , но получить объект […]

Как подавить предупреждение matplotlib?

Я получаю предупреждение от matplotlib каждый раз, когда я import pandas : /usr/local/lib/python2.7/site-packages/matplotlib/__init__.py:872: UserWarning: axes.color_cycle is deprecated and replaced with axes.prop_cycle; please use the latter. warnings.warn(self.msg_depr % (key, alt_key)) Каков наилучший способ его подавить? Все пакеты обновлены. Conf: OSX с пивом Python 2.7.10 (по умолчанию, 13 июля 2015, 12:05:58), и pandas == 0.17.0 и matplotlib […]

Могу ли я запустить numpy и pandas с помощью Jython

У нас есть некоторый код Java, который мы хотим использовать с новым кодом, который мы планируем написать в Python, поэтому мы заинтересованы в использовании Jython. Однако мы также хотим использовать библиотеки numpy и pandas для выполнения сложного статистического анализа в этом коде Python. Можно ли вызвать numpy и pandas из Jython?

Какой самый быстрый способ извлечь день, месяц и год с определенной даты?

Я прочитал файл csv, содержащий 150 000 строк в кадре данных pandas. Этот dataframe имеет поле «Дата» с датами в формате yyyy-mm-dd . Я хочу извлечь из него месяц, день и год и скопировать в столбцы dataframes, «Месяц», «День» и «Год» соответственно. Для нескольких сотен записей два нижеуказанных метода работают нормально, но для 150 000 […]

Утечка памяти с использованием кадра данных pandas

Я использую pandas.DataFrame в многопоточном коде (фактически пользовательский подкласс DataFrame называемый Sound ). Я заметил, что у меня есть утечка памяти, так как использование памяти моей программы постепенно увеличивается на 10 млн., Чтобы, наконец, достичь ~ 100% памяти компьютера и аварии. Я использовал objgraph, чтобы попытаться отслеживать эту утечку, и выяснил, что количество экземпляров MyDataFrame […]

python pandas: применить функцию с аргументами к ряду. Обновить

Я хотел бы применить функцию с аргументом к серии pandas: я нашел два разных решения SO: python pandas: применить функцию с аргументами к ряду а также Передача нескольких аргументов для применения (Python) оба они полагаются на использование functool.partial и они работают абсолютно нормально. Кстати, новая версия Pandas поддерживает несколько аргументов: в любом случае я не […]

получить первое и последнее значение в группе

У меня есть dataframe df df = pd.DataFrame(np.arange(20).reshape(10, -1), [['a', 'a', 'a', 'a', 'b', 'b', 'b', 'c', 'c', 'd'], ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']], ['X', 'Y']) Как получить первую и последнюю строки, сгруппированные по первому уровню индекса? Я пытался df.groupby(level=0).agg(['first', 'last']).stack() и получил XY a first 0 1 last 6 […]

Создание меток-точек из Spark DataFrame в Python

Какую функцию .map () в python я использую для создания набора меток-точек из блока данных искры? Что такое обозначение, если метка / результат не является первым столбцом, но я могу ссылаться на его имя столбца, «статус»? Я создаю фрейм данных python с помощью этой функции .map (): def parsePoint(line): listmp = list(line.split('\t')) dataframe = pd.DataFrame(pd.get_dummies(listmp[1:]).sum()).transpose() […]

Python - лучший язык программирования в мире.