Распознавать изображения в Python

Я новичок как для распознавания распознавания, так и для Python.

То, что я пытаюсь достичь, – запустить Tesseract из сценария Python, чтобы «распознать» некоторые фигуры в .tif.

Я думал, что смогу сделать тренировку для Tesseract, но я не нашел подобной темы в Google и здесь, в SO.

В основном у меня есть некоторый .tif, который содержит несколько изображений (например, «стрелка», «цветок» и другие значки), и я хочу, чтобы сценарий печатался в качестве вывода имени этого значка. Если он найдет стрелку, напечатайте «стрелку».

Возможно ли это?

One Solution collect form web for “Распознавать изображения в Python”

Это отнюдь не полный ответ, но если в tif есть несколько изображений, и если вы знаете размер заранее, вы можете стандартизировать образцы изображений до их классификации. Вы бы разрезали изображение во все возможные прямоугольники в tif.

Поэтому, когда вы создаете классификатор (я не упоминаю здесь методы), конечный результат потребует синтеза классификации всех меньших прямоугольников.

Так что, если с учетом tif, изображения «стрелка» или «цветок» составляют 16 пикселей на 16 пикселей, скажем, вы можете использовать Python PIL для создания образцов.

from PIL import Image image_samples = [] im = Image.open("input.tif") sample_dimensions = (16,16) for box in get_all_corner_combinations(im, sample_dimensions): image_samples.append(im.crop(box)) classifier = YourClassifier() classifications = [] for sample in image_samples: classifications.append (classifier (sample)) label = fuse_classifications (classifications) 

Опять же, я не говорил об учебном этапе написания YourClassifier . Но, надеюсь, это помогает в определении части проблемы.

Существует много исследований по предмету обучения классификации изображений, а также работе по очистке шума в изображениях до их классификации.

Рассмотрите возможность просмотра этой красивой коллекции существующих библиотек обучения Python.

http://scipy-lectures.github.com/advanced/scikit-learn/index.html

Существует много методов, которые также относятся к изображениям.

  • Вопрос OCR Python Tesseract
  • Нет имени модуля PIL и нет имени модуля pytesser Visual Studio
  • У Tesseract есть проблемы с чтением этой чрезвычайно простой строки чисел
  • Графика регистрации страницы границы фотографии (квазисканирование) книги. Какие алгоритмы, библиотеки в python использовать для обрезки?
  • TensorFlow: параметры не обновляются при обучении
  • Моя собственная программа OCR в Python
  • Простой (рабочий) рукописный распознавание цифр: как его улучшить?
  • Очистка изображения перед приложением OCR
  • Точная классификация бинарных изображений
  • Как лучше извлечь текст из изображения?
  • Извлечение кода с фотографии футболки через OCR
  • Python - лучший язык программирования в мире.