Tag: pdf

Как извлечь поля PDF из заполненной формы в Python?

Я пытаюсь использовать Python для обработки некоторых форм PDF, которые были заполнены и подписаны с помощью Adobe Acrobat Reader. Я пробовал: Демоверсия pdfminer : она не сбрасывала ни одну из заполненных данных. pyPdf : он максимировал ядро в течение 2 минут, когда я попытался загрузить файл с PdfFileReader (f), и я просто сдался и убил […]

Acrobat JavaScript – преобразование ссылок на страницы JavaScript на «реальные ссылки»

Ситуация: У меня есть ~ 1,000,000 PDF-файлов. Я использую Acrobat JavsScript для поиска определенных ключевых слов в каждом из PDF-файлов, а затем даю ключевое слово link by setAction("this.pageNum = n") . Значение pageNum , n, также генерируется моим скриптом. В результате пользователь может перейти на номер страницы n напрямую, щелкнув ссылку. Проблема: Я не хочу, […]

Django / django-easy-pdf: объект «NoneType» не имеет атрибута «encode»

Я пытаюсь заставить django-easy-pdf работать, но я получаю эту ошибку: Environment: Request Method: GET Request URL: http://localhost:8001/lld/tesco-greenfield-datacenter-deployment/pdf/ Django Version: 1.8.2 Python Version: 2.7.6 Installed Applications: ('django_admin_bootstrapped', 'django.contrib.admin', 'django.contrib.auth', 'django.contrib.contenttypes', 'django.contrib.sessions', 'django.contrib.messages', 'django.contrib.staticfiles', 'lld', 'registration') Installed Middleware: ('django.contrib.sessions.middleware.SessionMiddleware', 'django.middleware.common.CommonMiddleware', 'django.middleware.csrf.CsrfViewMiddleware', 'django.contrib.auth.middleware.AuthenticationMiddleware', 'django.contrib.auth.middleware.SessionAuthenticationMiddleware', 'django.contrib.messages.middleware.MessageMiddleware', 'django.middleware.clickjacking.XFrameOptionsMiddleware', 'django.middleware.security.SecurityMiddleware') Traceback: File "/usr/local/lib/python2.7/dist-packages/django/core/handlers/base.py" in get_response 132. response = wrapped_callback(request, *callback_args, **callback_kwargs) […]

Python PyPDF2 присоединяется к страницам

У меня есть PDF с большой таблицей, разделенной на страницах, поэтому мне нужно объединить таблицы на странице в большую таблицу на большой странице. Возможно ли это с PyPDF2 или другой библиотекой? ура

Использование PyPDF2 для объединения файлов в несколько выходных файлов

Вот код, который вызывает проблему. Цикл будет добавлять новый файл каждый раз, чего я не пытаюсь сделать. Например, outputfile1 является input1.pdf, outputfile2 является input1.pdf + input2.pdf … Я пытаюсь объединить файл 1x.pdf с файлами 1a.pdf + 1b.pdf + 1c.pdf в выходной файл1.pdf, а затем выполнить цикл и сделать то же самое для 2, 3 и […]

Возможно ли (как) добавить цвет пятна в pdf от matplotlib?

Я создаю диаграмму, которая должна использовать (несколько) цветов пятна. Этот цвет может быть недоступен из RGB или CMYK. Есть ли возможность указать цвет пятна для линии в matplotlib и экспортировать его в pdf? Прямой экспорт является предпочтительным, но не необходимым. Примечание. Цвет пятна – это цвет, который не обязательно устанавливается перед печатью и имеет только […]

Сохраните диаграмму диаграммы как изображение или в формате pdf с помощью python, flask и pisa / xhtml2pdf

Мое приложение находится в python, используя флеш-структуру. У меня есть диаграмма, которую я создал с chartlink. Я хотел бы включить его в pdf, который я выводил с помощью pisa. Это возможно? Есть ли способ сохранить диаграмму диаграммы как изображение? Или я должен заглянуть в другой вариант создания диаграммы, например, pygal или matplotlib?

Выведите документ (желательно PDF) из Python

У меня есть скрипт Python (3.5), который будет проходить через целую батарею тестов. Пользователь получает возможность выбирать, какие тесты заканчиваются N возможных тестов. Таким образом, пользователь может выполнить 1 тест до N тестов. Прямо сейчас, я просто выводя результаты теста на сюжет с matplotlib и это выглядит нормально, но они просто сохраняются как отдельные файлы. […]

imagemagick wand сохраняет pdf-страницы в качестве изображений

Я хотел бы использовать пакет imagemagick Wand для преобразования всех страниц pdf-файла в один файл изображения. У меня возникает следующая проблема (см. Комментарии ниже, которые указывают на проблему) import tempfile from wand.image import Image with file('my_pdf_with_5_pages.png') as f: image = Image(file=f, format='png') save_using_filename(image) save_using_file(image) def save_using_filename(image): with tempfile.NamedTemporaryFile() as temp: # this saves all pages, […]

Как перечислить все строки, содержащие PA / внутри html-файла, используя красивый суп

У меня есть программа, которая конвертирует pdf-файлы в html, и мне нужно было дополнить эту программу, поэтому после преобразования она будет искать теги PA / и персонажа перед ним и сохранять эти теги и символы в CSV-файле, я пытаюсь сделай это, но я не могу, мог бы кто-нибудь помочь мне, пожалуйста? Вот код: import shlex […]

Interesting Posts

Python – Дескриптор 'split' требует объекта 'str', но получил 'unicode'

Основные вопросы о вложенной блокмодели в графическом инструменте

Рекурсивная функция для создания иерархического объекта JSON?

проанализировать журнал сеансов whatsApp

Эффективное элементное деление матрицы, когда элементы в знаменателе могут быть равны нулю

Изменение папки dist dist с помощью setuptools

Самый быстрый способ построения матрицы с пользовательской архитектурой

кодек ascii не может декодировать ошибку при использовании pip для установки uwsgi

Сериализованный список для JSON

Как я могу векторизовать усреднение 2×2 суб-массивов массива numpy?

реверсивный список с использованием нотации среза

Использование PyLab для создания 2D-графика из двух отдельных списков

Генератор, который оставляет местозаполнитель в начале и в конце входного итератора целым

python pandas: переименовать серию в рамках фрейма данных?

Python: аргументы для использования itertools для разбиения списка на группы

Python - лучший язык программирования в мире.