Как установить english.pickle для nltk на автономной машине Linux

Я пытаюсь запустить nltk в ящике SUSE Linux, который нельзя подключить к Интернету.

Я успешно установил nltk, и он запускается, но когда я отправляю

>>> tagged = nltk.pos_tag(tokens) 

Я получаю эту ошибку:

LookupError:
************************************************** ********************
Ресурс 'токенизаторы / punkt / english.pickle' не найдены. Пожалуйста, используйте NLTK Downloader для получения ресурса:

Я не могу использовать загрузчик, так как я не могу подключить коробку к Интернету.

Кто-нибудь, как я могу установить необходимые пакеты?

3 Solutions collect form web for “Как установить english.pickle для nltk на автономной машине Linux”

Загружающий файл хранит файлы в определенной папке. Я предполагаю, что можно загрузить на онлайновой машине и скопировать файлы в эквивалентное место на автономном компьютере. На моей машине он загружается в /usr/local/lib/nltk_data .

Данные загружаются в каталог nltk_data . Где это отличается от одной системы к другой, но вы можете узнать, выполнив следующее:

 import nltk print nltk.data.find('.') 

english.pickle должен находиться в <nltk_data>/taggers/ . Самый простой способ добавить его – использовать загрузчик на компьютере с доступом в Интернет, затем скопировать его и поместить в одну и ту же подпапку. Существует только одна версия english.pickle , и вы можете загрузить ее в окне Windows, без проблем.

Для справочных целей (по состоянию на 2017 год) токенизаторы punkt находятся по этой ссылке в GitHub:

https://github.com/nltk/nltk_data/blob/gh-pages/packages/tokenizers/punkt.zip

Вы должны быть в состоянии загрузить с непереработанной машины и переместить ее на флешку.

  • Распределенные вычисления Python (работает)
  • Способы хранения и доступа к большим (~ 10 ГБ) спискам в Python?
  • Травление обученной модели НЛТК
  • Как проверить, какая деталь сложного объекта не может быть маринована
  • Python: Pickle и Qt (PyQT)
  • Unpickling объекты python с измененным пути модуля
  • В чем разница между режимами rb и r + b в файловых объектах
  • Ошибка пиренейского пика: UnicodeDecodeError
  •  
    Interesting Posts for Van-Lav

    Pandas: конвертировать временную метку в datetime.date

    Чтение файла с использованием «open ()« vs »с open ()«

    Помогите мне понять, почему Unicode работает иногда с Python

    Вопрос Bizzarre, пытающийся сделать Rpy2 2.1.9 работать с R 2.12.1, используя Python 2.6 под Windows xp – Rpy не может найти R.dll?

    Быстрый алгоритм b-сплайна с numpy / scipy

    Не удается перенаправить вывод, когда я запускаю скрипт Python в Windows, используя только имя скрипта

    Кодирование темы почты (SMTP) в Python с символами, отличными от ASCII

    Создание вложенных вызовов для «выполнения» с помощью библиотеки Fabric Python

    Tkinter.PhotoImage не поддерживает png-изображение

    Для установки Python pip требуется server_hostname

    Использование класса Python в качестве контейнера данных

    Ошибка при использовании Django-websocket

    Установка цвета ячейки RGB для ячейки с pywin32 в excel?

    Лучший способ конвертировать URL-адрес Unicode в ASCII (UTF-8-escaped) в Python?

    Python: ошибка Quadriatic Graph с несколькими номерами

    Python - лучший язык программирования в мире.