Tag: pandas

Объект DataFrame не имеет атрибута 'sort'

Я сталкиваюсь с некоторыми проблемами здесь, в моем пакете python я устанавливаю numpy, но у меня все еще есть эта ошибка. Объект DataFrame не имеет атрибута 'sort' Любой может дать мне некоторую идею .. Это мой код: final.loc[-1] =['', 'P','Actual'] final.index = final.index + 1 # shifting index final = final.sort() final.columns=[final.columns,final.iloc[0]] final = final.iloc[1:].reset_index(drop=True) […]

Как удалить дополнительную копию дублирующего индекса серии Pandas?

У меня есть серия s с двойным индексом: >>> s STK_ID RPT_Date 600809 20061231 demo_str 20070331 demo_str 20070630 demo_str 20070930 demo_str 20071231 demo_str 20060331 demo_str 20060630 demo_str 20060930 demo_str 20061231 demo_str 20070331 demo_str 20070630 demo_str Name: STK_Name, Length: 11 И я просто хочу сохранить уникальные строки и только одну копию повторяющихся строк: s[s.index.unique()] Pandas 0.10.1.dev-f7f7e13 […]

Лучший способ подсчета количества строк с отсутствующими значениями в pandas DataFrame

В настоящее время я придумал некоторые работы, чтобы подсчитать количество отсутствующих значений в pandas DataFrame . Это довольно уродливые, и мне интересно, есть ли лучший способ сделать это. Давайте создадим пример DataFrame : from numpy.random import randn df = pd.DataFrame(randn(5, 3), index=['a', 'c', 'e', 'f', 'h'], columns=['one', 'two', 'three']) df = df.reindex(['a', 'b', 'c', 'd', […]

Добавить ведущие нули в строки в Pandas Dataframe

У меня есть кадр данных pandas, где первые 3 столбца являются строками: ID text1 text 2 0 2345656 blah blah 1 3456 blah blah 2 541304 blah blah 3 201306 hi blah 4 12313201308 hello blah Я хочу добавить начальные нули в ID: ID text1 text 2 0 000000002345656 blah blah 1 000000000003456 blah blah […]

Преобразование серии Pandas, содержащей строку в boolean

У меня есть DataFrame с именем df as Order Number Status 1 1668 Undelivered 2 19771 Undelivered 3 100032108 Undelivered 4 2229 Delivered 5 00056 Undelivered Я хотел бы преобразовать столбец Status в boolean ( True когда Status Delivered и False когда Status Undelivered), но если Status не является ни «Undelivered», ни «Delivered», его следует […]

Установить порядок столбцов в кадре данных pandas

Есть ли способ переупорядочить столбцы в dataframe pandas на основе моих личных предпочтений (то есть не в алфавитном порядке или численном сортировке, а скорее в соответствии с некоторыми соглашениями)? Простой пример: frame = pd.DataFrame({ 'one thing':[1,2,3,4], 'second thing':[0.1,0.2,1,2], 'other thing':['a','e','i','o']}) производит это: one thing other thing second thing 0 1 a 0.1 1 2 e […]

Повышение эффективности функции ранжирования путем замены лямбда x на векторизация

У меня есть функция ранжирования, которую я применяю к большому количеству столбцов из нескольких миллионов строк, для чего требуется несколько минут. Удалив всю логику, готовящую данные для применения .rank( метод, т. .rank( образом: ranked = df[['period_id', 'sector_name'] + to_rank].groupby(['period_id', 'sector_name']).transform(lambda x: (x.rank(ascending = True) – 1)*100/len(x)) Мне удалось довести это до нескольких секунд. Тем не […]

Numpy: падение строк со всеми значениями nan или 0

Я хотел бы удалить все значения из таблицы, если строки = nan или 0 . Я знаю, что есть способ сделать это, используя pandas ie pandas.dropna(how = 'all') но мне нужен метод numpy для удаления строк со всеми nan или 0 . Есть ли эффективная реализация этого?

Как изменить порядок индексированных строк на основе списка в кадре данных Pandas

У меня есть кадр данных, который выглядит так: company Amazon Apple Yahoo name A 0 130 0 C 173 0 0 Z 0 0 150 Он был создан с использованием этого кода: import pandas as pd df = pd.DataFrame({'name' : ['A', 'Z','C'], 'company' : ['Apple', 'Yahoo','Amazon'], 'height' : [130, 150,173]}) df = df.pivot(index="name", columns="company", values="height").fillna(0) […]

Как узнать, откуда стоит предупреждение Python

Я все еще новичок в Python, используя Pandas, и у меня есть некоторые проблемы, отлаживающие мой скрипт Python. У меня есть следующее предупреждающее сообщение: […]\pandas\core\index.py:756: UnicodeWarning: Unicode equal comparison failed to convert both arguments to Unicode – interpreting them as being unequal return self._engine.get_loc(key) И не могу найти, откуда он. После некоторых исследований я попытался […]

Python - лучший язык программирования в мире.