Tag: pandas

Pandas: создание агрегированного столбца в DataFrame

Приведенный ниже пример DataFrame, In [83]: df = pd.DataFrame({'A':[1,1,2,2],'B':[1,2,1,2],'values':np.arange(10,30,5)}) df Out[83]: AB values 0 1 1 10 1 1 2 15 2 2 1 20 3 2 2 25 Какой простой способ создать новый столбец, содержащий некоторую агрегацию данных по одному из столбцов? Например, если я суммирую values по элементам в A In [84]: df.groupby('A').sum()['values'] […]

Разница во времени внутри группы по объектам в Python Pandas

У меня есть dataframe, который выглядит так: from to datetime other ————————————————- 11 1 2016-11-06 22:00:00 – 11 1 2016-11-06 20:00:00 – 11 1 2016-11-06 15:45:00 – 11 12 2016-11-06 15:00:00 – 11 1 2016-11-06 12:00:00 – 11 18 2016-11-05 10:00:00 – 11 12 2016-11-05 10:00:00 – 12 1 2016-10-05 10:00:59 – 12 3 2016-09-06 […]

Как удалить строку имени столбца из pandas DataFrame?

Скажем, я импортирую следующую таблицу Excel в df Val1 Val2 Val3 1 2 3 5 6 7 9 1 2 Как удалить строку имени столбца (в этом случае Val1, Val2, Val3), чтобы я мог экспортировать csv без имен столбцов, только данные? Я пробовал df.drop и df.ix [1:] и не добился успеха.

Как выбрать столбцы из dataframe с помощью регулярных выражений

У меня есть dataframe в python pandas. Структура кадра данных выглядит следующим образом: abc d1 d2 d3 10 14 12 44 45 78 Я хотел бы выбрать столбцы, начинающиеся с d. Есть простой способ достичь этого в python.

Панды суммируют по группам, но исключают определенные столбцы

Каков наилучший способ сделать groupby на кадре данных Pandas, но исключить некоторые столбцы из этой группы? Например, у меня есть foll. dataframe: Code Country Item_Code Item Ele_Code Unit Y1961 Y1962 Y1963 2 Afghanistan 15 Wheat 5312 Ha 10 20 30 2 Afghanistan 25 Maize 5312 Ha 10 20 30 4 Angola 15 Wheat 7312 Ha […]

сортировка по пользовательскому списку в пандах

После прочтения: http://pandas.pydata.org/pandas-docs/version/0.13.1/generated/pandas.DataFrame.sort.html Я все еще не могу понять, как отсортировать столбец по специальному списку. Очевидно, что сортировка по умолчанию – в алфавитном порядке. Я приведу пример. Вот мой (очень сокращенный) dataframe: Player Year Age Tm G 2967 Cedric Hunter 1991 27 CHH 6 5335 Maurice Baker 2004 25 VAN 7 13950 Ratko Varda 2001 […]

Вычислить средневзвешенное значение с помощью панды / данных

У меня есть следующая таблица. Я хочу рассчитать средневзвешенное значение, сгруппированное по каждой дате, исходя из приведенной ниже формулы. Я могу сделать это с использованием стандартного обычного кода, но если предположить, что эти данные находятся в кадре данных pandas, есть ли более простой способ добиться этого, а не через итерацию? Date ID wt value w_avg […]

Pandas: Reindex Unsorts Dataframe

У меня возникли проблемы с сортировкой, а затем сброс индекса в Pandas: dfm = dfm.sort(['delt'],ascending=False) dfm = dfm.reindex(index=range(1,len(dfm))) После того, как я переиндексируюсь, данные будут отменены. Моя конечная цель состоит в том, чтобы иметь отсортированный dataframe с номерами индексов от 1 -> len (dfm), поэтому, если есть лучший способ сделать это, я бы не возражал, […]

Как работают объекты панды Rolling?

Редактирование: я сконденсировал этот вопрос, учитывая, что он, вероятно, был слишком запутан для начала. Мясо вопроса выделено жирным шрифтом. Я хотел бы узнать больше об объекте, который фактически создан при использовании DataFrame.rolling или Series.rolling : print(type(df.rolling)) <class 'pandas.core.window.Rolling'> Некоторые предпосылки: рассмотрите часто используемую альтернативу с np.as_strided . Этот фрагмент кода сам по себе не важен, […]

Панды: Получите дублированные индексы

Учитывая данные, я хочу получить дублированные индексы, которые не имеют повторяющихся значений в столбцах, и посмотреть, какие значения отличаются друг от друга. В частности, у меня есть этот фреймворк: import pandas as pd wget https://www.dropbox.com/s/vmimze2g4lt4ud3/alt_exon_repeatmasker_intersect.bed alt_exon_repeatmasker = pd.read_table('alt_exon_repeatmasker_intersect.bed', header=None, index_col=3) In [74]: alt_exon_repeatmasker.index.is_unique Out[74]: False И некоторые индексы имеют повторяющиеся значения в 9-м столбце (тип […]

 
Interesting Posts for Van-Lav

Как вставить строку в фрейм данных при определенных условиях?

Включить URL-адреса Django в документацию Sphinx?

исключение дескриптора подпроцесса python

Обрабатывать исключение, созданное генератором

Как получить текст метки Tkinter?

Как сказать Python автоматически использовать настройку прокси-сервера в Windows XP, например, как вариант R2 в Интернете?

как исправить distutils.errors.DistutilsError на py2app?

Принудительный класс для вызова родительского метода при его переопределении

zc.buildout перестает работать: ImportError: нет модуля с именем apport.fileutils

как я могу показать иррациональное число до 100 десятичных знаков в python?

Проблема при импорте LoginManager из flask.ext.login

Python: NameError: свободная переменная 're', на которую ссылается перед присваиванием в охватывающей области

Средний -Питон

pydata blaze: позволяет ли параллельная обработка или нет?

Django CORS Access-Control-Allow-Origin отсутствует

Python - лучший язык программирования в мире.