Распознавать изображения в Python

Я новичок как для распознавания распознавания, так и для Python.

То, что я пытаюсь достичь, – запустить Tesseract из сценария Python, чтобы «распознать» некоторые фигуры в .tif.

Я думал, что смогу сделать тренировку для Tesseract, но я не нашел подобной темы в Google и здесь, в SO.

В основном у меня есть некоторый .tif, который содержит несколько изображений (например, «стрелка», «цветок» и другие значки), и я хочу, чтобы сценарий печатался в качестве вывода имени этого значка. Если он найдет стрелку, напечатайте «стрелку».

Возможно ли это?

One Solution collect form web for “Распознавать изображения в Python”

Это отнюдь не полный ответ, но если в tif есть несколько изображений, и если вы знаете размер заранее, вы можете стандартизировать образцы изображений до их классификации. Вы бы разрезали изображение во все возможные прямоугольники в tif.

Поэтому, когда вы создаете классификатор (я не упоминаю здесь методы), конечный результат потребует синтеза классификации всех меньших прямоугольников.

Так что, если с учетом tif, изображения «стрелка» или «цветок» составляют 16 пикселей на 16 пикселей, скажем, вы можете использовать Python PIL для создания образцов.

from PIL import Image image_samples = [] im = Image.open("input.tif") sample_dimensions = (16,16) for box in get_all_corner_combinations(im, sample_dimensions): image_samples.append(im.crop(box)) classifier = YourClassifier() classifications = [] for sample in image_samples: classifications.append (classifier (sample)) label = fuse_classifications (classifications) 

Опять же, я не говорил об учебном этапе написания YourClassifier . Но, надеюсь, это помогает в определении части проблемы.

Существует много исследований по предмету обучения классификации изображений, а также работе по очистке шума в изображениях до их классификации.

Рассмотрите возможность просмотра этой красивой коллекции существующих библиотек обучения Python.

http://scipy-lectures.github.com/advanced/scikit-learn/index.html

Существует много методов, которые также относятся к изображениям.

  • Обнаружение текстовой области в изображении с использованием python и opencv
  • Как удалить недопустимые символы между несколькими строками в python?
  • Библиотека OCR Python или механизм рукописного распознавания символов
  • Как найти все PDF-файлы на основе изображений?
  • Установка pytesser
  • Python, pyPdf, Adobe PDF Ошибка OCR: неподдерживаемый фильтр / lzwdecode
  • Почему pytesseract не распознает отдельные цифры?
  • OCR текста с низким разрешением из скриншотов
  •  
    Interesting Posts for Van-Lav

    Спектральная кластеризация, сегментация изображений и собственные векторы

    Чтение первых N строк файла в python

    Почему Pandas Transform терпит неудачу, если у вас есть только одна колонка

    Как настроить IP-адрес с помощью CherryPy?

    Есть ли способ получить локаль из страны или часового пояса?

    Как реализовать алгоритм ранжирования на моем веб-сайте для сортировки данных базы данных?

    Как мне вызвать один вид фляжки из другого?

    Как использовать транспорты inproc и ipc Zeromq?

    Как преобразовать некоторый символ в пятизначный unicode в Python 3.3?

    Django, обслуживающий мультимедийные файлы (загруженные пользователем файлы) в режиме спуска

    Без проверки версий или `six`, как я могу использовать` except MyError, e: `vs` except MyError as e` для работы с Python 2 и 3?

    Невозможный lookbehind с обратной рецензией

    Функция переключения имен Python

    Запрос многих из многих полей в шаблоне django

    Как выбрать только определенные столбцы из DataFrame с столбцами MultiIndex?

    Python - лучший язык программирования в мире.