Tag: pandas

Python: Как я могу получить строки, которые имеют максимальное значение группы, к которой они принадлежат?

Я пересказываю свой вопрос. Я ищу решение для следующей проблемы: У меня есть dataFrame, как: Sp Mt Value count 4 MM2 S4 bg 10 5 MM2 S4 dgd 1 6 MM4 S2 rd 2 7 MM4 S2 cb 8 8 MM4 S2 uyi 8 Моя цель состоит в том, чтобы получить ВСЕ строки, где count […]

Заполните Pandas SparseDataFrame из SciPy Sparse Coo Matrix

(Этот вопрос относится к «заполнению Pandas SparseDataFrame из SciPy Sparse Matrix» . Я хочу заполнить SparseDataFrame из scipy.sparse. Coo_matrix (в частности). Этот вопрос относится к другой SciPy Sparse Matrix ( csr ) … Итак, вот оно …) Я заметил, что у Панды теперь есть поддержка разреженных матриц и массивов . В настоящее время я создаю […]

Работа с установкойWithCopyWarning при назначении столбцов в Pandas

У меня есть DataFrame который я хочу расширить с помощью столбцов, содержащих данные из предыдущей строки. Этот скрипт выполняет задание: #!/usr/bin/env python3 import numpy as np import pandas as pd n = 2 df = pd.DataFrame({'A': [1,2,3,4,5], 'B': [0,1,1,0,0]}, columns=['A', 'B']) df2 = df[df['B'] == 0] print(df2) for i in range(1, n+1): df2['A_%d' % i] […]

Создайте pandas DataFrame как правильный формат: `DataError: нет числовых типов для агрегирования`

Вот панда DataFrame, с которым я хотел бы манипулировать: import pandas as pd data = {"grouping": ["item1", "item1", "item1", "item2", "item2", "item2", "item2", …], "labels": ["A", "B", "C", "A", "B", "C", "D", …], "count": [5, 1, 8, 3, 731, 189, 9, …]} df = pd.DataFrame(data) print(df) >>> grouping labels count 0 item1 A 5 1 […]

Измените частоту метки метки по оси x данных datetime в барочной таблице python, используя matplotlib

У меня есть сценарий, который принимает несколько файлов .csv и выводит несколько графиков. Данные являются дневными суммами осадков, поэтому ось х – это дата в дневном формате %d %m %Y Как и в случае, код пытается включить все 365 дней в метку, но ось x забивается. Какой код я могу использовать, например, только один ярлык […]

Группа Pandas посредством операций с фреймом данных

У меня есть кадр данных pandas, как показано ниже. UsrId JobNos 1 4 1 56 2 23 2 55 2 41 2 5 3 78 1 25 3 1 Я группирую по кадру данных на основе UsrId. Сгруппированный кадр данных будет концептуально выглядеть ниже. UsrId JobNos 1 [4,56,25] 2 [23,55,41,5] 3 [78,1] Теперь я ищу […]

Как создать DataFrame из строк при сохранении существующей схемы?

Если я вызываю map или mapPartition и моя функция получает строки из PySpark, то какой естественный способ создать локальный PySpark или Pandas DataFrame? Что-то, что объединяет строки и сохраняет схему? В настоящее время я делаю что-то вроде: def combine(partition): rows = [x for x in partition] dfpart = pd.DataFrame(rows,columns=rows[0].keys()) pandafunc(dfpart) mydf.mapPartition(combine)

Пользовательская сортировка с помощью Pandas

У меня есть следующий фреймворк данных, который я бы хотел сначала отсортировать по Criticality, а затем по имени: Name Criticality baz High foo Critical baz Low foo Medium bar High bar Low bar Medium … Я пытался сделать это, используя ответ, указанный в этом сообщении, но я просто не могу заставить его работать. Конечный результат […]

pandas читает json, не работая над MultiIndex

Я пытаюсь читать в df.to_json() созданный через df.to_json() через pd.read_json но я получаю ValueError . Я думаю, что это может быть связано с тем, что индекс является MultiIndex, но я не уверен, как с этим бороться. Исходный test.json называется psi и я создал test.json через: psi.head().to_json('test.json') Вот вывод print psi.head().to_string() если вы хотите его использовать. […]

Ошибка при извлечении данных из Yahoo Finance

Я пытаюсь извлечь данные из Yahoo Finance через Pandas. Раньше я использовал подобные притяжки, но перед этим не сталкивался import pandas as pd import numpy as np import datetime as dt from dateutil import parser from pandas_datareader import data from dateutil.relativedelta import relativedelta end_date=dt.datetime.today() begdate = end_date + relativedelta(years=-10) data1 = data.get_data_yahoo('^DJI',begdate,end_date,interval='m') Это ошибка, которую […]

Interesting Posts

Очень странное поведение оператора «есть» с методами

Как проверить, является ли каталог вспомогательной директорией другого каталога

Процесс многопроцессорности Python автоматически отключается

Как вызвать функцию задержки задачи сельдерея из языков, отличных от python, таких как Java?

Python: poweret заданного набора с генераторами

преобразование wav в mp3 (и наоборот) с использованием GStreamer

Различие XGBoost в тренировочных и тестовых функциях после преобразования в DMatrix

Как переопределить теги POS, назначенные тексту, по умолчанию nltk?

Простой пример управления пользователями для Google App Engine?

Каков самый быстрый (доступ к) структурно подобный объект в Python?

Сделайте снимок экрана с помощью скрипта python.

Общая xlabel / ylabel для подзаголовков matplotlib

Переменные Globals и многопроцессорность Python

Vim запуск ярлыка

Поиск самой длинной подстроки в алфавитном порядке

Python - лучший язык программирования в мире.