как реализовать тестирование ходьбы в sklearn?

В sklearn GridSearchCV может принимать конвейер в качестве параметра, чтобы найти наилучшую оценку путем перекрестной проверки. Однако обычная перекрестная проверка выглядит так: введите описание изображения здесь

для перекрестного проверки данных временных рядов данные обучения и тестирования часто разделяются следующим образом: введите описание изображения здесь

То есть, данные тестирования всегда должны быть впереди данных обучения.

Моя мысль такова:

  1. Напишите мой собственный класс версии k-fold и передайте его в GridSearchCV, чтобы я мог наслаждаться удобством конвейера. Проблема состоит в том, что представляется сложно позволить GridSearchCV использовать определенные показатели обучения и тестирования данных.

  2. Напишите новый класс GridSearchWalkForwardTest, который похож на GridSearchCV, я изучаю исходный код grid_search.py ​​и считаю, что это немного сложно.

Любое предложение приветствуется.

2 Solutions collect form web for “как реализовать тестирование ходьбы в sklearn?”

Мое мнение таково, что вы должны попытаться реализовать свой собственный GridSearchWalkForwardTest. Однажды я использовал GridSearch для обучения и реализовал один и тот же GridSearch, и я не получил таких же результатов, хотя я должен.

То, что я сделал в конце, использует мою собственную функцию. У вас больше контроля над учебным и тестовым набором, и у вас больше контроля над параметрами, которые вы тренируете.

Я думаю, вы могли бы использовать Split Time Series вместо своей собственной реализации или в качестве основы для реализации CV-метода, который точно так же, как вы его описываете.

После копания немного, кажется, кто-то добавил max_train_size к TimeSeriesSplit в этом PR, который кажется, что делает то, что вы хотите.

  • Ошибка при вызове scikit-learn с использованием сборки AMD64 для Scipy в Windows
  • Храните наиболее информативные функции от NLTK NaiveBayesClassifier в списке
  • Загрузка собственного текстового набора данных в scikit-learn
  • Как я могу вызвать классификаторы scikit-learn из Java?
  • Хотите знать diff среди pd.factorize, pd.get_dummies, sklearn.preprocessing.LableEncoder и OneHotEncoder
  • scikit узнать коэффициенты полиномиальные функции
  • как настроить параметры пользовательской функции ядра с помощью конвейера в scikit-learn
  • Выполнение оценки гиперпараметра для оценщика в каждом сводке рекурсивной функции Устранение
  • Python - лучший язык программирования в мире.