Tag: pandas

как рассчитать coskew и cokurtosis

Вы можете рассчитать перекос и эксцесс с помощью методов pd.Series.skew pd.Series.kurt pd.DataFrame.skew pd.DataFrame.kurt Однако нет удобного способа подсчета coskew или cokurtosis между переменными. Или, что еще лучше, матрица coskew или cokurtosis. Рассмотрим pd.DataFrame df import pandas as pd import numpy as np np.random.seed([3,1415]) df = pd.DataFrame(np.random.rand(10, 2), columns=list('ab')) df ab 0 0.444939 0.407554 1 0.460148 […]

Ускорение виртуального создания с помощью numpy и pandas

У меня есть несколько virtualenvs на одной машине, но все они нуждаются в numpy и pandas. Я хочу иметь отдельные копии для каждого virtualenv, но создание этих virtualenvs занимает довольно много времени. Есть ли какой-то четко определенный способ предварительной компиляции numpy и pandas на моей машине только один раз, а затем сделать что-то вроде: pip […]

Почему вы можете сделать df.loc (False) в пандах?

Я не вижу никакой документации по pandas, объясняющей параметр False, переданный в loc. Может ли кто-нибудь объяснить, как () и [] отличаются в этом случае?

Эффективное создание дополнительных столбцов в pandas DataFrame с использованием .map ()

Я анализирую набор данных, который похож по форме на следующий пример. У меня есть два разных типа данных (данные abc и xyz ): abc1 abc2 abc3 xyz1 xyz2 xyz3 0 1 2 2 2 1 2 1 2 1 1 2 1 1 2 2 2 1 2 2 2 3 1 2 1 1 […]

Python эквивалент функции головы и хвоста R

Я хочу просмотреть кадр данных Pandas. Я бы использовал head (mymatrix) в R, но я не знаю, как это сделать в Pandas Python. Когда я печатаю df.head (10) Я получаю … <class 'pandas.core.frame.DataFrame'> Int64Index: 10 entries, 0 to 9 Data columns (total 14 columns): #Book_Date 10 non-null values Item_Qty 10 non-null values Item_id 10 non-null […]

Возвратите несколько столбцов из применяемых панд

У меня есть pandas DataFrame, df_test . Он содержит столбец «размер», который представляет размер в байтах. Я вычислил KB, MB и GB, используя следующий код: df_test = pd.DataFrame([ {'dir': '/Users/uname1', 'size': 994933}, {'dir': '/Users/uname2', 'size': 109338711}, ]) df_test['size_kb'] = df_test['size'].astype(int).apply(lambda x: locale.format("%.1f", x / 1024.0, grouping=True) + ' KB') df_test['size_mb'] = df_test['size'].astype(int).apply(lambda x: locale.format("%.1f", x […]

В чем разница между функциями перекоса и эксцесса в пандах против скупых?

Я решил сравнить функции перекоса и эксцесса в пандах и scipy.stats, и не понимаю, почему у меня разные результаты между библиотеками. Насколько я могу судить по документации, обе функции куртоза вычисляются с использованием определения Фишера, тогда как для перекоса, похоже, недостаточно описания, чтобы определить, существуют ли какие-либо существенные отличия от того, как они вычисляются. import […]

Самый быстрый способ сбросить дублированный индекс в Pandas DataFrame

Если я хочу сбросить дублированный индекс в фреймворке данных, то по очевидным причинам следующее не работает: myDF.drop_duplicates(cols=index) а также myDF.drop_duplicates(cols='index') ищет столбец с именем 'index' Если я хочу сбросить индекс, я должен сделать: myDF['index'] = myDF.index myDF= myDF.drop_duplicates(cols='index') myDF.set_index = myDF['index'] myDF= myDF.drop('index', axis =1) Есть ли более эффективный способ?

Pandas MultiIndex против панели

Используя Pandas, в чем причины использования панели или MultiIndex DataFrame? Я лично нашел существенную разницу между ними в простоте доступа к разным измерениям / уровням, но это может быть только то, что я лучше знаком с интерфейсом для одного и другого. Однако я предполагаю, что существуют существенные различия.

Получить первый элемент серии без информации об индексе

Это так, что я могу получить первый элемент Seires без информации об индексе. Например, у нас есть серия import pandas as pd key='MCS096' SUBJECTS=pd.DataFrame({'ID':Series([146],index=[145]),\ 'study':Series(['MCS'],index=[145]),\ 'center':Series(['Mag'],index=[145]),\ 'initials':Series(['MCS096'],index=[145]) }) распечатывает СУБЪЕКТЫ: print (SUBJECTS[SUBJECTS.initials==key]['ID']) 145 146 Name: ID, dtype: int64 Как я могу получить значение здесь 146 без использования индекса 145? большое спасибо

Python - лучший язык программирования в мире.