Tag: dataframe

Пролитое значение из столбца в DataFrame с использованием Python

У меня есть кадр данных с 4 столбцами. ABCD e 2 = <0.1 e 2 = <0.11 e 2 = 0.1 e 2 = 0.1 e 2 = 0.1 e 2 = <0.14 Столбец D имеет некоторые значения с плавающей запятой, начинающиеся с '<', а некоторые без <<. Для строк, которые имеют «<» спереди, я […]

Использование вложенного dict в качестве таблицы поиска для фрейма данных pandas

У меня есть коэффициенты калибровки, которые необходимо применять после определенных дат и для определенных диапазонов показаний прибора, т.е. для более высокого показания потребуется другой калибровочный коэффициент. Я пытаюсь применить таблицу поиска, основанную на времени, а также необработанное чтение инструмента с использованием вложенного словаря python. Ниже приведен пример данных, с которыми я работаю: dates = pd.date_range('2013-05-06', […]

stack / unstack / pivot dataframe на python / pandas

У меня есть dataframe, который выглядит следующим образом: <class 'pandas.core.frame.DataFrame'> Int64Index: 198300 entries, 0 to 198299 Data columns (total 3 columns): var 198300 non-null values period 198300 non-null values value 141492 non-null values dtypes: float64(1), object(2) Я хотел бы изменить i из трех столбцов (var, period, value), чтобы иметь все значения переменной периода в виде […]

Эквивалентный t-тест приводит к PANDAS?

Я пытаюсь изучить немного PANDAS, и поэтому я просматриваю некоторый R-код и пытаюсь воспроизвести вещи на Python. У меня есть следующий простой пример tempdat <- data.frame(unit=c('feet','feet','feet','feet','metres','metres','metres','metres'), feet=c(50,45,75,60,26,32,40,45)) t.test(feet~unit, alternative='two.sided', conf.level=.95, var.equal=F, data=tempdat) Я хочу сделать эквивалентную функцию в Python, и это то, что у меня есть до сих пор, но результаты разные. tempdat = pd.DataFrame({'unit':['feet','feet','feet','feet','metres','metres','metres','metres'], […]

Pandas Dataframe Добавьте значение в новый столбец на основе предыдущей строки, ограниченной максимальным значением в этом столбце

Трудно узнать все трюки для панд или работать с файлами данных. Поэтому у меня есть df с определенным количеством недель. Я хотел создать таблицу метрик или фреймворк с дополнительными столбцами, добавленными с добавлением последовательных восходящих недель, только заполняя строку до максимального списка недель в столбце «Неделя», Week 0 201152 1 201201 2 201202 3 201203 […]

Pandas – сохранение нескольких значений в одной ячейке

У меня есть ответы на вопросник, и я начинаю использовать панды для их обработки. Пока это выглядит так: In[1]: questionnaire = pd.DataFrame([{'age': 72, 'sex': 'M'}, {'age': 80, 'sex': 'F'}], index=[np.array(['patient1', 'patient2'])]) questionnaire Out[1]: age sex patient1 72 M patient2 80 F In[2]: questionnaire.groupby('sex').size() Out[2]: sex F 1 M 1 Моя проблема заключается в том, что […]

Чтение последних нескольких строк с использованием read_csv в пандах

У меня есть файл, который постоянно растет как это HTTPS | webmail.mahindracomviva.com | заявка / vnd.ms-sync.wbxml | 158 | POST | 203.101.110.171 HTTPS | webmail.mahindracomviva.com || 0 | POST | 203.101.110.171 HTTPS | webmail.mahindracomviva.com || 0 | POST | 203.101.110.171 HTTPS | www.googleapis.com | применение / х-Protobuf | 246 | POST | 74.125.200.95 HTTPS | […]

Понимание группы Панды

Я новичок в Pandas и пытаюсь сделать некоторые основные преобразования данных. Один из методов, который я пытался использовать, – groupby , но я не понимаю результат, который я вижу. df = pd.DataFrame({'row': range(10), 'time': range(10), 'machine': ['M1', 'M2', 'M3', 'M1', 'M2', 'M3', 'M1', 'M2', 'M3', 'M1'], 'value1': range(10), 'value2': range(10)}) def func(g): print '—-', type(g) […]

Создайте многострочный граф, используя vincent из Pandas DataFrame

У меня проблема, подобная следующей: создание многострочного графика с помощью Vincent , но я не нашел решение. Я хочу отобразить многострочный график, чтобы получить количество обсуждений, обрабатываемых пользователями, в чат-инструменте для каждого часа дня. Я получил DataFrame со следующим форматом ниже. В левом столбце указаны часы, а каждый столбец – количество обсуждений пользователем за каждый […]

pandas csv написать по ascii игнорировать кодировку

Парсенс csv parser ( http://pandas.pydata.org/pandas-docs/stable/generated/pandas.io.parsers.read_csv.html ) поддерживает различные кодировки: import pandas data = pandas.read_csv(myfile, encoding='utf-8', quotechar='"', delimiter=',') Как реализовать ascii игнорировать случай кодирования для моего фрейма данных? encode('ascii', 'ignore')

Interesting Posts for Van-Lav

Поддержка Ctypes в Jython

«ImportError: No module named …» при импорте моего собственного модуля

В Python, как указать формат при преобразовании int в строку?

Сравнение списков, содержащих NaN

Скриптовый файл электронной почты на завершенной царапине

Почему работает следующее выражение генератора Python?

Сопутствующие значения в F #

Как я могу использовать словарь для сортировки результатов из текстового файла в алфавитном порядке, в среднем и от наивысшего до самого низкого?

множественная ошибка SparkContexts в учебнике

Использование имени списка в виде строки для доступа к списку

Подозрительная ошибка пирамирования с наибольшим совпадением

Как подсчитать все положительные и отрицательные значения в группе панд?

Как удалить всплывающие подсказки из данных Concatented Sound в PyAudio

NoReverseMatch при повторном тестировании регулярных выражений

Заказ списка словарей в python

Python - лучший язык программирования в мире.