не удалось использовать TfidfVectorizer в Google приложении

Я пишу программу python в Google App Engine, которая вычисляет tf-idf с помощью TfidfVectorizer в sklearn.

Я добавил библиотеку sklearn и импортирую как:

from sklearn.feature_extraction.text import TfidfVectorizer 

Однако он не дает мне no module named _check_build хотя он находится в библиотеке, которую я импортировал.

Примечание. У меня такой же код в чистом питоне, и он работает отлично, поэтому нет ничего плохого в синтаксисе или импорте python; Проблема начинается с GAE.

Вы знаете какой-либо способ решить эту проблему?

  • Создание манекена в конвейере с различными уровнями в поезде и тестовом наборе
  • Запуск SVM быстрее в python
  • Неожиданные оценки перекрестной проверки с помощью scikit-learn LinearRegression
  • Как добавить еще одну функцию (длину текста) в текущий пакет классификации слов? Scikit учиться
  • Почему scikit-learn вызывают сбрасывание ядра?
  • Как исправить проблему «NaN или бесконечность» для разреженной матрицы в python?
  • Pandas & Scikit: использование памяти при разрезании DataFrame
  • Слияние мешков слов scikits классификатор с произвольными числовыми полями
  • 2 Solutions collect form web for “не удалось использовать TfidfVectorizer в Google приложении”

    если вы не используете какие-либо инструменты, специфичные для GAE, попробуйте развернуть свое приложение на Heroku . Это позволит вам развертывать целую виртуальную среду со всеми установленными библиотеками на ней. В частности, Scikit-learn работает на Heroku просто отлично. Проверьте это репо Github, например.

    Вы не можете. В sklearn есть множество зависимостей 'c', и обычно любой модуль, который называется с ведущим _ является двоичным модулем.

    Вот почему вы получаете module named _check_build .

    Я серьезно сомневаюсь, что вы запустите его, даже если вы подделываете некоторые из «c» libs, если у них нет чистых аналогов python.

    Я сделал это в прошлом, когда у libs были версии производительности на основе «c», а также чистый python.

    Python - лучший язык программирования в мире.