Tag: pandas

Pandas EWMA работает не так, как ожидалось

Я пытаюсь вычислить EWMA с помощью панд, но результат не тот, который я ожидал. Я думаю, что 4-й элемент должен быть 13.179, но панда дает 13.121. Я преобразовал коэффициент распада (а) в центр масс по формуле, указанной в документации . Я что-то не понимаю? In[222]: y Out[222]: 0 NaN 1 NaN 2 13.192161 3 13.109292 […]

Pandas преобразует dtype-объект в строку

У меня проблемы с преобразованием dtype столбца. Я загружаю файл csv из yahoo finance. dt = pd.read_csv('data/Tesla.csv') это дает мне следующую информацию: <class 'pandas.core.frame.DataFrame'> Int64Index: 923 entries, 0 to 922 Data columns (total 7 columns): Date 923 non-null object Open 923 non-null float64 High 923 non-null float64 Low 923 non-null float64 Close 923 non-null float64 […]

Каково определение среднего в кадре данных панд?

У меня есть фрейм данных и хотелось бы получить среднее значение из одного из столбцов. Если я сделаю: print df['col_name'][0:1] print df['col_name'][0:1].mean() Я получил: 0 2 Name: col_name 2.0 Если я сделаю: print df['col_name'][0:2] print df['col_name'][0:2].mean() Я получил: 0 2 1 1 Name: col_name 10.5 Если я сделаю: print df['col_name'][0:3] print df['col_name'][0:3].mean() Я получил: 0 […]

Pandas: почему DataFrame.apply (f, axis = 1) вызывает f, когда DataFrame пуст?

Почему метод DataFrame.apply Pandas вызывает функцию, применяемую, когда DataFrame пуст? Например: >>> import pandas as pd >>> df = pd.DataFrame({"foo": []}) >>> df Empty DataFrame Columns: [foo] Index: [] >>> x = [] >>> df.apply(x.append, axis=1) Series([], dtype: float64) >>> x [Series([], dtype: float64)] # <<< why was the apply callback called with an empty […]

Pandas read_csv с использованием dtype

Я пытаюсь читать в csv-файле, используя pandas, используя параметр dtype, и у меня есть ошибка. Моя файловая структура csv выглядит следующим образом: "USAF","WBAN","STATION NAME","CTRY","FIPS","STATE","CALL","LAT","LON","ELEV(.1M)","BEGIN","END" "006852","99999","SENT","SW","SZ","","","+46817","+010350","+14200","","" "007005","99999","CWOS 07005","","","","","-99999","-999999","-99999","20120127","20120127" Причина, по которой мне нужно указать dtype, состоит в том, что первые два столбца иногда начинаются с нулей, а когда я регулярно читаю, он преобразует число, например 0006852, […]

Фильтр Pandas DataFrame с использованием другого DataFrame

У меня есть мультииндексный DataFrame с первым уровнем как идентификатор группы, а второй уровень – как имя элемента. Есть еще много групп, но показано только первое. 2000-01-04 2000-01-05 Group Element 1 A -0.011374 0.035895 X -0.006910 0.047714 C -0.016609 0.038705 Y -0.088110 -0.052775 H 0.000000 0.008082 У меня есть еще один DataFrame, содержащий только 1 […]

pandas: булевское индексирование с несколькими индексами

Здесь много вопросов с похожими названиями, но я не мог найти тот, который решает эту проблему. У меня есть dataframes из разных источников, и я хочу отфильтровать один за другим. Использование логической индексации отлично работает, когда логическая серия имеет тот же размер, что и отфильтрованный фреймворк данных, но не тогда, когда размер серии совпадает с […]

Pandas – Серия плотин

У меня есть dataframe, который индексируется столбцом datetime, и я получаю value_count () для разных временных диапазонов. Например, data['leadsource_ch_disp_name'].ix[rng[0]].value_counts() возвращается Unknown 223 Sponsorship 889 Reseller 145 Referral 52 dtype: int64 который представляет собой серию. Я хочу сделать это с 5 различными временными диапазонами ( rng[i] для i = [0, .., 4]). Итак, я остался с […]

pandas lookup daily series значение для полчаса индекса данных

У меня есть фрейм данных pandas с полчасовым индексом таймсерии и серией ежедневных данных, которые мне нужно сопоставить на основе даты для уравнения. Следующий код работает с использованием .get () в цикле, но медленный и кажется скорее «непитомным». Я попытался превратить серию в фреймворк с фиктивным столбцом, чтобы попытаться объединить или найти, но по разным […]

Манипуляция и построение графических данных Pandas

Используя WinPython 3.4, matplotlib 1.3.1, я вытягиваю данные для фрейма данных из базы данных mysql. Необработанный кадр данных, который я получаю из запроса, выглядит так: wafer_number test_type test_pass x_coord y_coord test_el_id wavelength intensity 0 HT2731 T2 1 38 54 24 288.68 4413 1 HT2731 T2 1 40 54 25 257.42 2595 2 HT2731 T2 1 […]

Interesting Posts for Van-Lav

gae python ascii codec can not decode byte

Фильтр Flask-SQLAlchemy для многих-многих отношений с родительской моделью

как вычислить новый столбец на основе значений других столбцов в pandas – python

Можно ли создавать разные длины тайм-аута сеанса для разных пользователей в Python Flask?

Импорт майави из python создает всплывающее окно с черным фоном в пользовательском интерфейсе (Mavericks / Canopy)

autoreload и package, вызывающие TypeError: super (type, obj): obj должен быть экземпляром или подтипом типа

Строка заменяет гласные в Python?

Класс словаря Python, 'KeyError'

Какая функция в искре используется для объединения двух RDD по ключам

Замена функциональности PIL (ImageDraw) в Google App Engine (GAE)

Установка MySQL-python на Mac

Разделите два списка в python

Выполнять поиск и замену всех файлов в папке через python?

Пул многопроцессорности Pathos Ошибка CPickle

Django: Как использовать строку в качестве ключевого слова в операторе Q ()?

Python - лучший язык программирования в мире.