Tag: pandas

Функция распределения вероятности Python

У меня есть набор исходных данных, и я должен определить распределение этих данных. Каков самый простой способ построения функции распределения вероятности? Я попытался подгонять его в нормальном распределении. Но мне любопытно узнать, какое распространение данные несут в себе? У меня нет кода, чтобы показать мой прогресс, поскольку мне не удалось найти какие-либо функции в python, […]

Pandas – удаление строк на основе комбинаций значений NaN

У меня есть кадр данных, который выглядит примерно так: NUM ABCDEF p1 NaN -1.183 NaN NaN NaN 1.829711 p5 NaN NaN NaN NaN 1.267 -1.552721 p9 1.138 NaN NaN -1.179 NaN 1.227306 В столбце F и по крайней мере одном другом столбце AE всегда есть значение, отличное от NaN. Я хочу создать подтаблицу, содержащую только […]

Python pandas dataframe slicing, если условие

У меня есть объект DataFrame с несколькими столбцами: business_id , categories , type_of_business … Мне удалось создать меньший DataFrame с только business_id и categories по индексам столбцов на исходном объекте DataFrame. categories – это список определенных строк. Пример: ['Restaurant, 'food', 'bakery'] – для каждого business_id . Одна из категорий – Restaurants . Как получить только […]

Сюжет Панды не накладывается

Я пытаюсь наложить сложную гистограмму с графиком линии, как из приведенного ниже примера, но показан только второй график и не может понять, почему. import pandas as pd from matplotlib import pyplot as plt df=pd.DataFrame({'yarding, mobile cable yarder on trailer': {1928: 1.4027824821879459e-20, 1924: 3.4365045943961052e-37, 1925: 6.9939032596152882e-30, 1926: 1.0712940173393567e-25, 1927: 8.6539917152671678e-23}, 'yarding and processing, mobile cable yarder […]

Pandas расширяет поле json через записи

У меня есть интересная проблема, и мне интересно, существует ли лаконичный, pythonic (pandastic?) Способ сделать это, а не итерировать по строкам кадра данных. Возьмите DataFrame с одним полем, которое представляет собой json-кодирование информации: Name Data 0 Joe '[{"label":"a","value":"1"},{"label":"b","value":"2"}]' 1 Sue '[{"label":"a","value":"3"},{"label":"c","value":"4"}]' 2 Bob '[{"label":"b","value":"4"},{"label":"d","value":"1"}]' Я хочу расширить поле json, чтобы быть полями данных, объединяя разные […]

эквивалент pandas np.where

np.where имеет семантику векторизованного if / else (аналогично Apache Spark, when / otherwise метод DataFrame). Я знаю, что я могу использовать np.where в pandas Series , но pandas часто определяет свой собственный API для использования вместо функций raw numpy , что обычно более удобно с pd.Series / pd.DataFrame . Конечно, я нашел pandas.DataFrame.where . Однако, […]

Pandas DataFrame вставляет / заполняет пробелы из предыдущих дат

У меня есть DataFrame состоящий из date s, других столбцов и числового значения, где некоторые комбинации значений в «других столбцах» могут отсутствовать, и я хочу заполнить их с предыдущей date s. Пример. Скажем, DataFrame похож на ниже. Вы можете увидеть в 2016-01-01 , у нас есть данные для (LN, A) , (LN, B) , (NY, […]

Подсчитайте количество записей, отличных от NaN, в каждом столбце Dataframe

У меня действительно большой DataFrame, и мне было интересно, есть ли короткий (один или два лайнера) способ получить количество записей, отличных от NaN, в DataFrame. Я не хочу делать этот столбец за один раз, так как у меня около 1000 столбцов. df1 = pd.DataFrame([(1,2,None),(None,4,None),(5,None,7),(5,None,None)], columns=['a','b','d'], index = ['A', 'B','C','D']) abd A 1 2 NaN B […]

Фильтр Pandas DataFrame по индексу времени

У меня есть панда DataFrame с 6:36 до 17:31. Я хочу удалить все наблюдения, где время меньше 8:00:00. Вот моя попытка: df = df[df.index < '2013-10-16 08:00:00'] Это ничего не помогает, пожалуйста, помогите.

Pandas создает новый столбец из строкового фрагмента другого столбца

Я хочу создать новый столбец в Pandas, используя строку, нарезанную для другого столбца в dataframe. Например. Sample Value New_sample AAB 23 A BAB 25 B Где New_sample – новый столбец, сформированный из простого фрагмента [:1] примера Я пробовал несколько вещей безрезультатно – я чувствую, что мне не хватает чего-то простого. Каков наиболее эффективный способ сделать […]

Python - лучший язык программирования в мире.