Tag: pandas

Неожиданный результат при повышении дискретизации почасовых значений с использованием функции resample pandas

Я пытаюсь TimeSeries ежедневные значения TimeSeries используя функцию TimeSeries pandas. Когда я повышаю выборку на один день (2012-01-01), я ожидаю, что результат будет средним для дня, рассматриваемого для повышения частоты дискретизации. Результат должен выглядеть так: 2012-01-01 -0,285344 Freq: D Однако панды возвращают два дня: 2012-01-01 -0.412417 2012-01-02 0.127073 Freq: D Это ошибка или функция? Если […]

добавление столбцов дает NaN в pandas DataFrame

Мне нужно добавить столбцы итеративно к объекту DataFrame. Это упрощенная версия: >>> x=DataFrame() >>> for i in 'ps': … x = x.append(DataFrame({i:[3,4]})) … >>> x ps 0 3 NaN 1 4 NaN 0 NaN 3 1 NaN 4 Что мне делать, чтобы получить: ps 0 3 3 1 4 4 ?

Добавление баров ошибок в Matplotlib-сгенерированный граф данных Pandas создает неверную легенду

Я пытаюсь построить графический файл Pandas с использованием Matplotlib. Dataframe содержит четыре столбца данных, состоящие из натуральных чисел и индекс целых чисел. Я хотел бы создать единый график с линейными графиками для каждого из четырех столбцов, а также строки ошибок для каждой точки. Кроме того, я хотел бы создать легенду, дающую метки для каждой из […]

Доступ к pandas Multiindex Dataframe с использованием целых индексов

У меня есть следующие панды Dataframe: from pandas import DataFrame, MultiIndex index = MultiIndex.from_tuples(zip([21,22,23],[45,45,46]), names=['A', 'B']) df = DataFrame({'values': [0.67, 0.87, 0.23]}, index=index) Out[10]: values AB 21 45 0.67 22 45 0.87 23 46 0.23 Каков правильный способ доступа к значению для элемента (22,45)? Я пробовал все очевидные альтернативы, но любой из них, похоже, работает: […]

Как сохранить MultiIndex при использовании слияния pandas

Аналогичный вопрос задавался в разделе Как сохранить индекс при использовании слияния pandas , но он не будет работать с MultiIndexes, т. Е. a = DataFrame(np.array([1,2,3,4,1,2,3,3]).reshape((4,2)), columns=['col1','to_merge_on'], index=['a','b','a','b']) id = pd.MultiIndex.from_arrays([[1,1,2,2],['a','b','a','b']], names =['id1','id2']) a.index = id In [207]: a Out[207]: col1 to_merge_on id1 id2 1 a 1 2 b 3 4 2 a 1 2 b […]

pandas dataframe index error: AssertionError: длины индекса и значения не совпадают

Я пытаюсь запустить моделирование модели на PiCloud и разобраться с результатами с Pandas. (PiCloud – это в основном интерфейс к кластеру Amazon, через который я запускаю вещи в виртуальной среде Ubuntu 11.04). Кажется, что проблемная команда: fplf_df = pd.DataFrame(fpld, columns = var_name_list, index = sample_names_ordered) fpld – это dict (61 ключ, который является строками, а […]

Как получить ярлыки ярлыков для нерегулярно выбранных временных рядов?

У меня есть серия Pandas, отобранная в нерегулярные времена (примерно 5 с, но всегда с задержкой в ​​несколько мс из-за латентности). Могу ли я построить эти данные, чтобы иметь ярлыки ярлыков x-axis ? До сих пор я получаю только это: >>> print(bare_data.index) <class 'pandas.tseries.index.DatetimeIndex'> [2012-11-08 12:00:05.130309, …, 2012-11-09 11:38:18.997584] Length: 16332, Freq: None, Timezone: None […]

Как группировать индекс первого уровня и применять функцию ко второму индексу в Pandas

У меня многоуровневый dataframe 'df' следующим образом: col1 col2 first second a 0 5 5 1 5 5 2 5 5 b 0 5 5 1 5 5 И я хочу применить функцию func (exp: 'lambda x: x*10' ) ко second , несколько наподобие: df.groupby(level='first').second.apply(func) и результат будет выглядеть следующим образом: col1 col2 first second […]

pandas: Multiply MultiIndex DataFrame с серией

У меня есть MultiIndex DataFrame, который содержит эти значения: AAPL minor 2007-09-14 OC 0.024436 2007-09-15 CC 0.030293 CO 0.017518 OC 0.024688 OO 0.031835 # to_dict(): {'AAPL': {(<Timestamp: 2007-09-14 00:00:00>, 'OC'): 0.024436265475779286, (<Timestamp: 2007-09-15 00:00:00>, 'CC'): 0.030293017084353703, (<Timestamp: 2007-09-15 00:00:00>, 'CO'): 0.017518449703066673, (<Timestamp: 2007-09-15 00:00:00>, 'OC'): 0.024688182799779634, (<Timestamp: 2007-09-15 00:00:00>, 'OO'): 0.031834725061579666}} – и ряд, содержащий […]

Как транслировать по одному индексу в иерархически индексированном DataFrame?

У меня есть иерархически индексированный фрейм данных: >>> import pandas as pd >>> df = pd.DataFrame(np.arange(4), index=[['John', 'John', 'Vicki', 'Vicki'], ['a','b', 'a','b']], columns=['score']) score John a 0 b 1 Vicki a 2 b 3 и ряд с индексом, идентичным первому уровню индекса в приведенном выше кадре данных: >>> series = pd.Series([100, 200], index=['John', 'Vicki']) John […]

Python - лучший язык программирования в мире.