Tag: pandas

Понимание вывода из рекурсивной функции

Я пытаюсь запустить функцию obtainingparams рекурсивно в 5 раз. Однако в настоящее время выход из моей программы выглядит следующим образом, и я действительно не могу понять, почему строка 32323232 в цикле while в конце кода не распечатывается после каждого набора MATRIX , PARAMS , VALUES . MATRIX [[ 1. 7.53869055 7.10409234 -0.2867544 ] [ 1. […]

Эффективно расширяйте линии от панд DataFrame

Я новичок в pandas, и я пытаюсь прочитать странный форматированный файл в DataFrame. Исходный файл выглядит так: ; No Time Date MoistAve MatTemp TDRConduct TDRAve DeltaCount tpAve Moist1 Moist2 Moist3 Moist4 TDR1 TDR2 TDR3 TDR4 1 11:38:17 11.07.2012 11.37 48.20 5.15 88.87 15 344.50 11.84 11.35 11.59 15.25 89.0 89.0 89.0 88.0 2 11:38:18 11.07.2012 […]

Панды и Google Analytics

Я использую Pandas для доступа и анализа данных Google Analytics в течение нескольких месяцев, но вчера мой код не удался, и я не уверен, почему. Даже используя самый простой пример (как указано в документации), функция ga.read_ga возвращает ошибку: AttributeError Traceback (most recent call last) /Library/Python/2.7/site-packages/ipython-0.13.1-py2.7.egg/IPython/utils/py3compat.pyc in execfile(fname, *where) 176 else: 177 filename = fname –> […]

Pandas to_dict изменяет тип индекса с outtype = 'records'

Я пытаюсь вызвать функцию to_dict для следующего DataFrame: import pandas as pd data = {"a": [1,2,3,4,5], "b": [90,80,40,60,30]} df = pd.DataFrame (данные) ab 0 1 90 1 2 80 2 3 40 3 4 60 4 5 30 df.reset_index (). to_dict ( "г") [{'a': 1, 'b': 90, 'index': 0}, {'a': 2, 'b': 80, 'index': 1}, […]

sort_by сломанный в pandas> = 0.18.0?

Я начинаю с кадра данных как print(df) int float _i 1 2 2.000000e+00 1 3 3 3.000000e+00 3 2 3 4.000000e+00 2 4 -9223372036854775808 -1.797693e+308 4 0 -9223372036854775808 1.000000e+00 0 Если я использую sort_values для сортировки по двум столбцам, я получаю вывод, который вы видите ниже. Поэтому sort_values ничего не делает. Если у меня только […]

как векторизовать вычисление Pandas, основанное на последних x строках данных

У меня есть довольно изощренный код предсказания с 20 столбцами, миллионы данных на столбец с помощью wls. Теперь я использую iterrow для прокрутки дат, а затем, основываясь на этих датах и ​​значениях в эти даты, извлекает разные размеры данных для расчета. для выполнения моей работы требуется несколько часов, я упрощаю код следующим образом: import pandas […]

повторная выборка данных, не относящихся к временным рядам

У меня есть некоторые данные, которые я обрабатываю с помощью dataframes и pandas. Они содержат около 10 000 строк и 6 столбцов. Проблема в том, что я провел несколько испытаний, а разные наборы данных имеют несколько разные номера индексов. (Это испытание «сила-длина» с несколькими материалами, и, конечно, точки измерения отлично не отличаются). Теперь моя идея […]

Pandas to_csv () медленное сохранение большого кадра данных

Я предполагаю, что это легкое исправление, но я столкнулся с проблемой, которая занимает около часа, чтобы сохранить файл данных pandas в файл csv, используя функцию to_csv () . Я использую anaconda python 2.7.12 с pandas (0.19.1). import os import glob import pandas as pd src_files = glob.glob(os.path.join('/my/path', "*.csv.gz")) # 1 – Takes 2 min to […]

Дельта дня для дат> 292 года друг от друга

Я пытаюсь получить дедту дня для широкого диапазона дат панд. Однако для временных дельт> 292 года я получаю отрицательные значения. Например, import pandas as pd dates = pd.Series(pd.date_range('1700-01-01', periods=4500, freq='m')) days_delta = (dates-dates.min()).astype('timedelta64[D]') Однако, используя DatetimeIndex, я могу это сделать, и он работает так, как я хочу, import pandas as pd import numpy as np […]

Pandas Panel fancy indexing: как вернуть (индекс) всех DataFrames в Panel на основе логического числа из нескольких столбцов в каждом df

У меня есть панель Pandas со многими DataFrames с одинаковыми ярлыками строк / столбцов. Я хочу создать новую панель с DataFrames, которые удовлетворяют определенным критериям на основе нескольких столбцов. Это легко с кадрами данных и строками: Скажем, у меня есть df, zHe_compare. Я могу получить подходящие строки: zHe_compare[(zHe_compare['zHe_calc'] > 100) & (zHe_compare['zHe_med'] > 100) | […]

 
Interesting Posts for Van-Lav

Есть ли какой-либо рабочий профилировщик памяти для Python3

Как python находит файл модуля, если оператор import содержит только имя файла?

Сравнение двух списков координат в python и использование значений координат для назначения значений

сопоставление шаблонов в malayalam делает TypeError: ожидаемая строка или буфер

Как использовать CherryPy для обслуживания нескольких доменов?

Сортированный по длине список, но такой же длины в алфавитном порядке на этапе

Лучший способ создать класс «generic», наследующий внешние классы модулей

Прокрутка в Selenium Webdriver (Python)

Установите значение в dict, только если значение еще не установлено

python: Что происходит, когда атрибут класса, атрибут экземпляра и метод имеют одно и то же имя?

Использовать подстановочный знак в массиве Python?

Сериализация двоичных данных в Python

Суммируйте одно число для каждого элемента в списке (или массиве) в Python

Консолидация маршрутизации с помощью RabbitMQ и Python

Удаление дубликатов из вложенного списка на основе первых 2 элементов

Python - лучший язык программирования в мире.