Tag: pandas

Пол или потолок серии панд в питоне?

У меня серия series панд. Если я хочу получить элементарный пол или потолок, есть ли встроенный метод или мне нужно написать функцию и использовать ее? Я спрашиваю, потому что данные большие, поэтому я ценю эффективность. Также этот вопрос не задавался в отношении пакета Pandas.

Изменить текст метки легенды основного сюжета

До сих пор я был в состоянии подписать подзаголовки просто отлично, но у меня проблема с основной. Вот соответствующая часть моего кода: data_BS_P = data[channels[0]] data_BS_R = data[channels[1]] data_BS_Y = data[channels[2]] plot_BS_P = data_BS_P.plot() #data_BS_P is a pandas dataframe axBS = plot_BS_P.gca() axBS.plot(data_BS_R, label='Roll') axBS.plot(data_BS_Y, label='Yaw') axBS.set_ylabel('Amplitude (urad)') axBS.legend(loc='upper center', bbox_to_anchor=(0.5, 1.05), ncol=3, fancybox=True, shadow=True) […]

добавить столбцы разной длины pandas

У меня проблема с добавлением столбцов в пандах. У меня DataFrame, размер nxk. И в процессе мне нужно добавить столбцы с размером mx1, где m = [1, n], но я не знаю m. Когда я попытаюсь сделать это: df['Name column'] = data # type(data) = list результат: AssertionError: Length of values does not match length […]

Подмножество pandas dataframe

У меня есть DataFrame, загруженный из файла tsv. Я хотел создать несколько поисковых участков. Проблема в том, что набор данных большой (~ 1 миллион строк), поэтому на графике слишком много точек, чтобы увидеть тренд. Кроме того, на графику требуется некоторое время. Я хотел подмножить 10000 случайно распределенных строк. Кроме того, это должно быть воспроизводимым, поэтому […]

'/' в именах в файловой системе HDF5

Я испытываю некоторые действительно странные взаимодействия между h5py , PyTables (через Pandas ) и C ++ сгенерированными файлами HDF5 . Кажется, что h5check и h5py, похоже, справляются с именами типов, содержащими «/», но pandas / PyTables не могут. Ясно, что в моем понимании есть пробел, поэтому: Что я здесь не понял? Сведения о gory У […]

Эффективный способ получения уникальных значений из 2 или более столбцов в Dataframe

Учитывая матрицу из SFrame : >>> from sframe import SFrame >>> sf =SFrame({'x':[1,1,2,5,7], 'y':[2,4,6,8,2], 'z':[2,5,8,6,2]}) >>> sf Columns: x int y int z int Rows: 5 Data: +—+—+—+ | x | y | z | +—+—+—+ | 1 | 2 | 2 | | 1 | 4 | 5 | | 2 | 6 | […]

Графическая диаграмма из Pandas DataFrame

Предполагая, что у меня есть DataFrame который выглядит так: Hour | V1 | V2 | A1 | A2 0 | 15 | 13 | 25 | 37 1 | 26 | 52 | 21 | 45 2 | 18 | 45 | 45 | 25 3 | 65 | 38 | 98 | 14 Я […]

отключить кадр данных индекса pandas

Как я могу сбросить или отключить индексы в кадре данных pandas? Я изучаю панды из книги «python для анализа данных», и я уже знаю, что могу использовать dataframe.drop для удаления одного столбца или одной строки. Но я ничего не нашел об отключении всех индексов.

визуализация визуализации интерактивной визуализации гистограммы

У меня есть df, который выглядит так: df.head() Out[1]: ABC city0 40 12 73 city1 65 56 10 city2 77 58 71 city3 89 53 49 city4 33 98 90 Пример df может быть создан с помощью следующего кода: df = pd.DataFrame(np.random.randint(100,size=(1000000,3)), columns=list('ABC')) indx = ['city'+str(x) for x in range(0,1000000)] df.index = indx Я хочу […]

векторизовать значение процентиля столбца B столбца A (для групп)

Для каждой пары городов src и dest аэропортов я хочу вернуть процентиль столбца, заданное значение столбца b . Я могу сделать это вручную как таковое: пример df только с двумя парами src / dest (у меня есть тысячи в моем фактическом df): dt src dest ab 0 2016-01-01 YYZ SFO 548.12 279.28 1 2016-01-01 DFW […]

Python - лучший язык программирования в мире.