Доведите свой собственный открытый LLM до совершенства с использованием последних техник

Достигайте идеальности с помощью последних техник прически для вашего открытого LLM

В этой статье я настраиваю базовую модель LLama2 LLM для вывода SQL-кода. Я использую методы эффективной настройки параметров для оптимизации процесса.

Источник: https://www.pexels.com/photo/calm-body-of-lake-between-mountains-346529/

В предыдущей статье я начал аргументировать, почему стоит рассмотреть возможность обучения собственной модели LLM. Я также привел краткое введение в аппаратные требования, а также методы оптимизации обучения и вывода. В этой статье я расскажу, как точно настроить существующую модель LLM и предоставлю фрагменты кода, чтобы вы могли следовать за мной и воспроизвести результаты. Мы будем настраивать модель Llama2–7B, чтобы получить SQL-запрос на основе ввода на естественном языке — другими словами, модель будет преобразовывать наш вопрос, заданный на естественном языке:

«Сколько клиентов решили купить яйца в ноябре?»

В SQL-запрос, который выберет соответствующий результат:

SELECT COUNT(DISTINCT customer_id) AS num_customersFROM purchasesWHERE product_name = 'eggs'AND EXTRACT(MONTH FROM purchase_date) = 11;

В каждом случае для работы с моделью LLM будет представлена схема базы данных (БД):

CREATE TABLE purchases (    purchase_id INT PRIMARY KEY,    customer_id INT,    product_name VARCHAR(255),    purchase_date DATE);

Мы будем использовать этот набор данных в процессе настройки. Хотя эта статья в основном сосредоточена на достижении указанной задачи, методология будет представлена таким образом, чтобы вы могли адаптировать процесс настройки под свои потребности.

В этой статье я буду использовать Google Colab для настройки LLM. Мы будем использовать набор данных know_sql (OpenRAIL лицензия), о котором я упоминал ранее. Мы также будем использовать фреймворк axolotl для обработки процесса настройки. У них на GitHub есть отличная документация. Вместо написания примерно 100 строк кода для ручной обработки процесса настройки, axolotl позволяет нам просто редактировать файл конфигурации YAML для соответствующей модели, которую мы хотим настроить. В этой статье я расскажу о точном процессе, но рекомендую ознакомиться с документацией axolotl, если что-то неясно.