Исследователи из CMU и Университета Цинхуа предлагают Prompt2Model общий метод, который генерирует применимые модели искусственного интеллекта из инструкций на естественном языке.

Researchers from CMU and Tsinghua University propose Prompt2Model, a general method for generating AI models from natural language instructions.

“`html

Представьте, что вы хотите создать модель обработки естественного языка (Natural Language Processing, NLP), решающую определенную проблему. Вам необходимо определить область задачи, затем найти или создать данные, которые определяют предполагаемое поведение системы, выбрать подходящую архитектуру модели, обучить модель, оценить ее производительность с помощью оценки, а затем развернуть ее для использования в реальном мире. Исследователям удалось создать прототип таких моделей NLP, с помощью одной строки кода!

https://arxiv.org/abs/2308.12261

Prompt2Model – это система, которая позволяет задавать поведение системы с помощью простых подсказок и одновременно предоставляет развертываемую модель специального назначения, сохраняя все ее преимущества. На рисунке выше показана рабочая архитектура нашего Prompt2Model. По сути, это работает как автоматизированный конвейер, который извлекает все необходимые детали о задаче из пользовательских подсказок, а затем собирает и объединяет связанную с задачей информацию и разворачивает ее с использованием различных каналов.

  • Извлечение набора данных: При заданной подсказке первая задача состоит в поиске существующих ручных аннотаций данных, которые могут поддерживать описание задачи пользователя.
  • Создание набора данных: Чтобы поддерживать широкий спектр задач, существует генератор набора данных, который производит синтетические тренировочные данные в соответствии с конкретными требованиями пользователя, разобранными на основе анализа подсказок. Анализ подсказок включает LLM с внутренним обучением в контексте, который используется для сегментации пользовательских подсказок с использованием gpt-3.5-turbo-0613 от OpenAI.
  • Извлечение модели: Используя предоставленную подсказку, выбирается предварительно обученная языковая модель с соответствующими знаниями для цели пользователя. Эта выбранная модель служит в качестве модели-ученика и далее донастраивается и оценивается с использованием сгенерированных и извлеченных данных.
  • Веб-приложение: Наконец, существует простой в использовании графический интерфейс пользователя, который позволяет конечным пользователям взаимодействовать с обученной моделью. Это веб-приложение, созданное с использованием Gradio, может быть легко развернуто публично на сервере.

В заключение, Prompt2Model – это инструмент для быстрого создания небольших и компетентных систем NLP. Он может быть использован напрямую для создания моделей, специфичных для задачи, которые превосходят LLM в течение нескольких часов без ручной аннотации данных или архитектуры. Благодаря гибкому дизайну модели, она может предложить платформу для исследования новых техник в области уплотнения модели, генерации набора данных, синтетической оценки, извлечения набора данных и извлечения модели.

Впереди мы можем представить Prompt2Model как катализатор совместной инновации. Предлагая различные задачи, исследователи стремятся способствовать развитию разнообразных реализаций и улучшений в рамках компонентов фреймворка в будущем.

“`