Tag: pandas

Python Pandas Crosstabs

Новое для Pandas и довольно новое для Python. Я пытаюсь создать отчет кросс-таблицы из следующих данных – просто показывая несколько строк. PALLET_ID AISLE NUM_PALLETS 7197033 AH 1 7197035 AC 1 7197035 AC 1 7197035 AC 1 7197035 AC 1 7197035 AC 1 I Sofastats Я получаю простой кросс-таблицу таблицы частоты поддонов в проходах – то […]

Фильтровать запрос с помощью связанного ключа объекта в SQLAlchemy

Судя по названию, это будет тот же самый вопрос, но я не вижу, как любой из ответов применим к моему варианту использования: У меня есть два класса и взаимосвязь между ними: treatment_association = Table('tr_association', Base.metadata, Column('chronic_treatments_id', Integer, ForeignKey('chronic_treatments.code')), Column('animals_id', Integer, ForeignKey('animals.id')) ) class ChronicTreatment(Base): __tablename__ = "chronic_treatments" code = Column(String, primary_key=True) class Animal(Base): __tablename__ = […]

Как сбросить нулевые значения в Pandas?

Я пытаюсь сбросить нулевые значения столбца «Возраст» в dataframe, который состоит из значений float, но он не работает. Я пытался data.dropna(subset=['Age'], how='all') data['Age'] = data['Age'].dropna() data=data.dropna(axis=1,how='all') Он работает для других столбцов, но не для 'Age' Pclass Fare Age Sex 0 3 7.2500 22.0 1 1 1 71.2833 38.0 0 2 3 7.9250 26.0 0 3 […]

Python Pandas: как читать сгруппированные данные, разделенные headres?

У меня есть дата в текстовом файле: AL012015, Kevin, 20, 20151108, 1800, , XY, 22.2A, 71.5B, 30, 10, 20151108, 1800, , XY, 22.2A, 71.5B, 30, 10, 20151108, 1800, , ZZ, 22.2A, 71.5B, 30, 10, AL022015, Mike, 20, 20151108, 1800, , XX, 22.2A, 71.5B, 30, 10, 20151108, 1800, , YY, 22.2A, 71.5B, 30, 10, Я хотел […]

Выбирайте только числовые поля, в том числе содержащие поплавки из pandas dataframe

Исходный фрейм данных (df): AB 0 1 green 1 2 red 2 s blue 3 4.3 yellow 4 b black Ожидаемый фрейм данных (df) после выбора: AB 0 1 green 1 2 red 3 4.3 yellow Попытка: Ни df[df['A'].astype(str).str.isdigit()] ни df[df['A'].astype(str).str.isdemical()] может получить ожидаемый результат, но как ниже : AB 0 1 green 1 2 […]

Необходимо создать кадр данных Pandas, прочитав csv-файл со случайными столбцами

У меня есть следующий файл csv с записями: A 1, B 2, C 10, D 15 A 5, D 10, G 2 D 6, E 7 H 7, G 8 Мои заголовки / имена столбцов: A, B, C, D, E, F, G Поэтому мой начальный фрейм после использования «read_csv» становится: ABCDEFGA 1 B 2 C […]

Pandas MultiIndex из регулярного выражения на столбце

У меня есть рамка данных pandas, которая выглядит df = pd.DataFrame( [ ['JoeSmith', 5], ['CathySmith', 3], ['BrianSmith', 12], ['MarySmith', 67], ['JoeJones', 23], ['CathyJones', 98], ['BrianJones', 438], ['MaryJones', 75], ['JoeCollins', 56], ['CathyCollins', 125], ['BrianCollins', 900], ['MaryCollins', 321], ], columns = ['Name', 'Value'] ) print df Name Value 0 JoeSmith 5 1 CathySmith 3 2 BrianSmith 12 […]

Вопросы времени и времени, в то время как предсказание временных рядов в Pandas

Попытка реализовать модель прогнозирования временных рядов на python, но столкнувшись с проблемами с данными datetime. Поэтому у меня есть dataframe 'df' с двумя столбцами типа datetime и float: Затем я пытаюсь построить массив с использованием метода значений. Но происходит странное странное событие, и оно отображает дату в странном формате с отметками времени и временем: И […]

Как получить все уникальные слова в кадре данных?

У меня есть dataframe со списком продуктов и соответствующим обзором + ——— + ————————————— ——— + | продукт | обзор | + ——— + ————————————— ——— + | product_a | Это хорошо для случайного обеда | + ——— + ————————————— ——— + | product_b | Эйвери – один из самых узнаваемых баристов | + ——— […]

Как использовать значения суммы матрицы с фильтром

Я читаю файл с помощью панд. d = pandas.DataFrame ("data.csv") data.csv ABC d 408.56087701 87.26907024 b 277.95015117 75.19386881 b 385.41416264 84.73488504 b 380.31630662 71.23504808 b 392.10729207 83.80720357 b 399.70877373 76.59640833 b 350.93124656 79.34979059 b 330.09702335 79.37166555 назад = [399.70877373,385.41416264] Я пытаюсь суммировать значения C, где я нахожу совпадение между «спиной» и столбцом B s=0 for […]

Python - лучший язык программирования в мире.