Повторная выборка мультииндекса DataFrame

Я хочу перепрограммировать DataFrame с помощью мультииндекса, содержащего столбец datetime и некоторый другой ключ. Dataframe выглядит так:

import pandas as pd from StringIO import StringIO csv = StringIO("""ID,NAME,DATE,VAR1 1,a,03-JAN-2013,69 1,a,04-JAN-2013,77 1,a,05-JAN-2013,75 2,b,03-JAN-2013,69 2,b,04-JAN-2013,75 2,b,05-JAN-2013,72""") df = pd.read_csv(csv, index_col=['DATE', 'ID'], parse_dates=['DATE']) df.columns.name = 'Params' 

Поскольку передискретизация разрешена только для индексов данных, я подумал о том, что отстегнуть другой столбец индекса поможет. И действительно, это так, но я не могу уложить его снова после этого.

 print df.unstack('ID').resample('W-THU') Params VAR1 ID 1 2 DATE 2013-01-03 69 69.0 2013-01-10 76 73.5 

Но тогда укладка «ID» снова приводит к ошибке индекса:

 print df.unstack('ID').resample('W-THU').stack('ID') IndexError: index 0 is out of bounds for axis 0 with size 0 

Как ни странно, я могу уложить другой уровень столбца с обоими:

 print df.unstack('ID').resample('W-THU').stack(0) 

а также

 print df.unstack('ID').resample('W-THU').stack('Params') 

Ошибка индекса также возникает, если я меняю порядок (свопинг) на оба уровня столбца. Кто-нибудь знает, как преодолеть эту проблему?

  • Как использовать pd.concat с un init-dataframe?
  • Pandas - Заменить значения в DataFrame на основе Boollean DataFrame
  • Вычислить смешанную модель возврата в Python
  • Как получить значение из ячейки фрейма данных?
  • Pandas удаляет части строки после указанного символа внутри фрейма данных
  • python pandas to_sql с sqlalchemy: как ускорить экспорт в MS SQL?
  • NumPy или Pandas: сохранение типа массива как целого с использованием значения NaN
  • Как разбить данные на 3 набора (поезд, валидация и тест)?
  • One Solution collect form web for “Повторная выборка мультииндекса DataFrame”

    В этом примере выполняется нечетный столбец «NAME», который молча удаляется, но вызывает проблемы при повторной укладке. Код ниже работал для меня

     print df[['VAR1']].unstack('ID').resample('W-THU').stack('ID') Params VAR1 DATE ID 2013-01-03 A 69.0 B 69.0 2013-01-10 A 76.0 B 73.5 
    Python - лучший язык программирования в мире.