Основы инженерии 101 нулевое, единичное и малое количество подсказок

Основы инженерии 101 - подсказки в небольшом объеме

Введение в базовую стратегию создания подсказок

Изображение от Alexandra_Koch на Pixabay

Введение

Несмотря на свои видимо сверхъестественные возможности, LLM-модели в конечном счете являются предиктивными моделями, которые просто предсказывают следующее слово в последовательности слов на основе предоставленного контекста.

Поэтому их производительность не зависит только от огромных объемов данных, на которых они обучены; они также сильно зависят от контекста, предоставленного через ввод пользователей.

Часто использующиеся чат-боты, работающие на основе LLM, осознают важность контекста. Без достаточного контекста чат-боты, будь то общедоступные сервисы (например, ChatGPT) или индивидуально созданные продукты на основе LLM, будут иметь трудности с выполнением более сложных инструкций.

Здесь мы подробно рассмотрим одну из самых базовых стратегий, используемых для правильного ответа LLM на подсказки: предоставление контекста внутри пользовательских подсказок. Обычно это делается с помощью трех различных методов: нулевой подсказки, однократной подсказки и нескольких подсказок.

Нулевая подсказка

Если вы уже взаимодействовали с чат-ботом, работающим на основе LLM, то, скорее всего, вы уже неосознанно использовали нулевую подсказку. Нулевая подсказка подразумевает полагаться исключительно на предварительно обученную информацию LLM для ответа на заданную пользовательскую подсказку.

Например, предположим, что мы используем ChatGPT в качестве классификатора настроения. Ввод с нулевой подсказкой будет выглядеть так:

Пользовательская подсказка: “Определите настроение этого предложения. Предложение: «Этот баскетбольный мяч имеет большой вес».”

ChatGPT: “Настроение предложения «Этот баскетбольный мяч имеет большой вес» является нейтральным. Оно не передает позитивное или негативное настроение, а лишь предоставляет фактическую информацию о весе баскетбольного мяча.”

При предоставлении запроса LLM без дополнительного контекста оценивает это предложение как нейтральное.

Хотя этот метод обычно может давать удовлетворительные ответы, он может быть недостаточным, если сложность вопроса высока или критерии для ответа отличаются от нормы.