Как создать чат-бот LLaMa 2 с использованием Gradio и Hugging Face в бесплатной среде Colab.

Создание чат-бота LLaMa 2 с помощью Gradio и Hugging Face в Colab.

Благодаря Gradio вы можете создать пользовательский интерфейс чатбота в одной строке кода!

Изображение, созданное автором с помощью Leonardo.ai. Подсказка: «Человек в традиционной перуанской одежде, в глубоком разговоре с умной ламой, в фоне Перуанские Анды»

Ландшафт открытых моделей больших языков очень интересен.

На момент написания этой статьи модели LLaMa 2 получают больше всего внимания. Поэтому стоит научиться общаться с этими моделями.

В этой статье вы узнаете, как создать чатбота с помощью Gradio ChatInterface и Hugging Face. И вы сможете запустить код в бесплатной записной книжке Colab!

Поскольку мы рассмотрим каждый шаг, этот учебник подойдет для начинающих. Однако опытные инженеры также многое узнают, так как мы говорим о передовых технологиях, таких как Llama 2.

Рабочий процесс

В этом пошаговом руководстве мы пройдем следующие шаги:

  1. Установка: Начнем с настройки нашей среды с необходимыми библиотеками.
  2. Предварительные требования: Убедитесь, что у вас есть доступ к модели Llama-2 7B на Hugging Face.
  3. Загрузка модели и токенизатора: Получите модель и токенизатор для нашей сессии.
  4. Создание конвейера Llama: Подготовьте нашу модель для генерации ответов.
  5. Форматирование подсказки для Llama 2: Подготовьте сообщения, чтобы следовать правильной структуре подсказок.
  6. Генерация ответов Llama: Создайте функцию для получения ответов на основе истории вашего чата.
  7. Взаимодействие с Llama через ChatInterface Gradio: Запросите модель для получения ответов и исследуйте ее возможности.

Примечание: В конце этой статьи вы найдете все полезные ссылки, включая готовую записную книжку Colab с описанием проекта (и видеоверсию этого руководства).

Погрузимся и повеселимся!

Предварительные требования.

Прежде чем перейти к коду, вам потребуется потратить 2 минуты на выполнение этих 3 необходимых шагов:

  1. Убедитесь, что вы переключили свою среду выполнения Colab на GPU для оптимальной производительности. В верхнем меню перейдите к Среда выполнения -> Изменить тип среды выполнения и выберите «T4 GPU».
  2. Создайте учетную запись Hugging Face, чтобы получить доступ…