Синтетические образы устанавливают новый стандарт эффективности обучения искусственного интеллекта.

Синтетические образы новый стандарт эффективности обучения искусственного интеллекта.

Исследователи первыми показали, что модели, обученные исключительно с использованием синтетических изображений, превосходят своих конкурентов, обученных с использованием реальных изображений, в крупномасштабных настройках. ¶ Автор: Алекс Шиппс/MIT CSAIL через генератор изображений Midjourney AI

Команда исследователей под руководством Массачусетского технологического института (MIT) продемонстрировала, что обучение моделей машинного обучения с использованием синтетических изображений может превзойти традиционные методы обучения, использующие реальные изображения.

Стратегия, известная как “мультипозитивное контрастное обучение”, использует StableRep для создания синтетических изображений с использованием моделей текст-в-изображение, таких как Stable Diffusion.

StableRep позволяет регулировать “масштаб руководства” в генеративной модели, балансируя разнообразие и достоверность синтетических изображений.

Исследователи также создали StableRep+ с добавлением языкового контроля. Они обучили StableRep+ с использованием 20 миллионов синтетических изображений и установили, что он эффективнее моделей CLIP, обученных с использованием 50 миллионов реальных изображений. Однако исследователи признали, что выбор текстовых подсказок не является полностью без предвзятости.

Лиджи Фан из MIT заявил: “Используя последние модели текст-в-изображение, мы получили беспрецедентный контроль над генерацией изображений, что позволяет получать разнообразную визуальную информацию из одного текстового ввода. Это превосходит сбор реальных изображений по эффективности и универсальности”. С МIT News Полная статья

Аннотация Авторские права © 2023 SmithBucklin, Вашингтон, США