Поиск изображений за 5 минут

Ищите изображения всего за 5 минут

Самый современный поиск изображений просто и быстро

«Подсчет векторов» автором с использованием MidJourney. Все изображения автора, если не указано иное.

В этой статье мы будем осуществлять поиск изображений по тексту (позволяя нам искать изображение по тексту) и поиск изображений по изображению (позволяя нам искать изображение на основе опорного изображения) с использованием легкой предварительно обученной модели. Модель, которую мы будем использовать для расчета сходства изображений и текста, вдохновлена противопоставительным языком предварительного обучения изображений (CLIP), о котором я рассказываю в другой статье.

Результаты при поиске изображений с текстом «радуга над водой»

Для кого это полезно? Любые разработчики, которые хотят реализовать поиск изображений, ученые-практики заинтересованные в практических приложениях или непрофессиональные читатели, которые хотят узнать о искусственном интеллекте на практике.

На сколько продвинута эта статья? В этой статье мы рассмотрим реализацию поиска изображений как можно быстрее и проще.

Предварительные требования: Опыт в основах программирования.

Что мы делаем и как мы это делаем

Эта статья является спутником моей статьи о «Противопоставительном языко-изображении предварительном обучении». Пожалуйста, ознакомьтесь с ней, если вы хотите получить более полное понимание теории:

CLIP, Интуитивно и Подробно Объяснено

Создание сильных представлений изображений и языка для задач машинного обучения.

towardsdatascience.com

CLIP-модели обучены предсказывать, принадлежит ли произвольное заголовок произвольному изображению. Мы будем использовать эту общую функциональность для создания нашей системы поиска изображений. Конкретно, мы будем использовать энкодеры изображений и текста от CLIP для сжатия входных данных в вектор, который можно рассматривать как сводку входных данных.

Задача энкодера - суммировать входные данные в осмысленное представление, называемое вектором сводки. Изображение из моей статьи о CLIP.

Вся суть CLIP заключается в том, что похожий текст и изображения имеют похожие векторные представления.