Синтетические образы устанавливают новый стандарт эффективности обучения искусственного интеллекта.
Синтетические образы новый стандарт эффективности обучения искусственного интеллекта.
![Исследователи первыми показали, что модели, обученные исключительно с использованием синтетических изображений, превосходят своих конкурентов, обученных с использованием реальных изображений, в крупномасштабных настройках. ¶ Автор: Алекс Шиппс/MIT CSAIL через генератор изображений Midjourney AI](https://ai.miximages.com/cacm.acm.org/system/assets/0004/6715/112823_Alex_Shipps-MIT_CSAIL_via_the_Midjourney_AI_image_generator__StableRep2-transformed.large.jpg?1701191645&1701191645)
Команда исследователей под руководством Массачусетского технологического института (MIT) продемонстрировала, что обучение моделей машинного обучения с использованием синтетических изображений может превзойти традиционные методы обучения, использующие реальные изображения.
Стратегия, известная как “мультипозитивное контрастное обучение”, использует StableRep для создания синтетических изображений с использованием моделей текст-в-изображение, таких как Stable Diffusion.
StableRep позволяет регулировать “масштаб руководства” в генеративной модели, балансируя разнообразие и достоверность синтетических изображений.
Исследователи также создали StableRep+ с добавлением языкового контроля. Они обучили StableRep+ с использованием 20 миллионов синтетических изображений и установили, что он эффективнее моделей CLIP, обученных с использованием 50 миллионов реальных изображений. Однако исследователи признали, что выбор текстовых подсказок не является полностью без предвзятости.
- Anthropic Releases Claude 2.1 Революционизация корпоративного ИИ с расширенным контекстным окном и повышенной точностью
- Платформа корпоративного искусственного интеллекта с Amazon Bedrock.
- Общайтесь со своим PDF с помощью API-интерфейса OpenAI Assistant
Лиджи Фан из MIT заявил: “Используя последние модели текст-в-изображение, мы получили беспрецедентный контроль над генерацией изображений, что позволяет получать разнообразную визуальную информацию из одного текстового ввода. Это превосходит сбор реальных изображений по эффективности и универсальности”. С МIT News Полная статья
Аннотация Авторские права © 2023 SmithBucklin, Вашингтон, США