Tag: warc

Python не может полностью прочитать файл «warc.gz»

Для моей работы я очищаю веб-сайты и записываю их в gzipped web-архивы (с расширением «warc.gz»). Я использую Python 2.7.11 и библиотеку warc 0.2.1. Я заметил, что для большинства файлов я не могу полностью их прочитать с помощью warc-библиотеки. Например, если файл warc.gz имеет 517 записей, я могу прочитать только около 200 из них. После некоторых […]

Python - лучший язык программирования в мире.