Tag: pandas

Более быстрый способ удаления выбросов по группам в больших пандах DataFrame

У меня относительно большой объект DataFrame (около миллиона строк, сотни столбцов), и я хотел бы кликать выбросы в каждом столбце по группе. Под «клип-выбросами для каждого столбца по группе» я имею в виду – вычислить кванты 5% и 95% для каждого столбца в группе и значения клипа вне этого диапазона квантилей. Вот настройка, которую я […]

Выберите строку из DataFrame в зависимости от типа объекта (например, str)

Итак, есть DataFrame: >>> df = pd.DataFrame({ … 'A':[1,2,'Three',4], … 'B':[1,'Two',3,4]}) >>> df AB 0 1 1 1 2 Two 2 Three 3 3 4 4 Я хочу выбрать строки, для которых тип данных конкретной строки определенного столбца имеет тип str . Например, я хочу выбрать строку, где type данных в столбце A является str […]

Загрузите высокоразмерный набор данных R в Pandas DataFrame

Некоторые R-массивы данных можно легко загрузить в Pandas DataFrame или Panel : import pandas.rpy.common as com infert = com.load_data('infert') print(infert.head()) Похоже, что это работает до тех пор, пока размер набора данных R <= 3. В более высоких размерных наборах данных отображается сообщение об ошибке: In [67]: com.load_data('Titanic') Cannot handle dim=4 Это сообщение об ошибке возникает […]

Python Pandas: как установить значение столбца Dataframe в качестве меток оси X

Скажем, у меня есть данные в следующем формате: Region Men Women City1 10 5 City2 50 89 Когда я загружаю его в Dataframe и график графика, он показывает индекс как метки оси X, а не название Region . Как получить имена по оси X? До сих пор я пытался: import pandas as pd import matplotlib.pyplot […]

t на кадры данных Pandas и создать новую матрицу из полученных значений p

У меня есть 3 кадра данных, содержащих 7 столбцов. df_a df_b df_c df_a.head() VSPD1_perc VSPD2_perc VSPD3_perc VSPD4_perc VSPD5_perc VSPD6_perc \ 0 NaN NaN NaN NaN NaN NaN 3 0.189588 0.228052 0.268460 0.304063 0.009837 0 5 0.134684 0.242556 0.449054 0.168816 0.004890 0 9 0.174806 0.232150 0.381936 0.211108 0.000000 0 11 NaN NaN NaN NaN NaN NaN […]

Как преобразовать эту запутанную строку Python в R

Я очень новичок в Python, и мне интересно, что делает следующая строка кода и как она может быть записана в R: df['sticky'] = df[['humidity', 'workingday']].apply(lambda x: (0, 1)[x['workingday'] == 1 and x['humidity'] >= 60], axis = 1) Например, в чем смысл lambda x: (0, 1) ? PS df – это рамка данных pandas

Pandas GroupBy от Element и всего остального

Мне тяжело использовать Pandas groupby. Скажем, у меня есть следующее: df2 = pd.DataFrame({'X' : ['B', 'B', 'A', 'A', 'C'], 'Y' : [1, 2, 3, 4, 5]}) Я хочу сделать операцию groupby, чтобы собрать группу A вместе, а не вместе, а вот что-то вроде этого: df2.groupby(<something>).groups Out[1]: {'A': [2, 3], 'not A': [0, 1, 4]} – […]

Размер заглавного заголовка pandas в записной книжке ipython

Я построил два участка бок о бок в ячейке ноутбука ipython. Но у меня возникают проблемы с изменением размера заголовка. Я могу изменить размер меток, добавив аргумент fontsize = 20 . Как изменить заголовок для df и df2 . fig, axes = plt.subplots(ncols=2, figsize = (20,10)) df.plot('barh', title = 'Legal Collectible Answer Distribution', fontsize = […]

AttributeError: объект DataFrame не имеет атрибута

Я продолжаю получать разные ошибки атрибутов при попытке запустить этот файл в ipython … новичок с пандами, так что, возможно, я что-то пропустил Код: from pandas import Series, DataFrame import pandas as pd import json nan=float('NaN') data = [] with open('file.json') as f: for line in f: data.append(json.loads(line)) df = DataFrame(data, columns=['accepted', 'user', 'object', 'response']) […]

Pandon pandas: добавление столбца в сгруппированный DataFrame с цепочкой методов

Сначала позвольте сказать, что я новичок в пандах. Я пытаюсь создать новый столбец в DataFrame. Я могу сделать это, как показано в моем примере. Но я хочу сделать это, используя методы цепочки, поэтому мне не нужно назначать новые переменные. Позвольте мне сначала показать, чего я хочу достичь, и то, что я сделал это до сих […]

Python - лучший язык программирования в мире.