Обучение языковых моделей использованию инструментов
Обучение языковых моделей
Использование инструментов делает нас более способными, как людей. Правда ли это относится к LLM?

По мере того, как мы узнаем больше о них, большие языковые модели (LLM) становятся все более интересными. Эти модели могут точно решать различные сложные задачи. В то же время они имеют проблемы с определенными функциями, которые мы, как люди, считаем базовыми! Например, LLM часто допускают арифметические ошибки, не имеют доступа к актуальной информации и даже испытывают трудности в понимании хода времени. С учетом этих ограничений возникает вопрос, что можно сделать, чтобы сделать LLM более способными. Обречены ли LLM на то, чтобы всегда страдать от этих ограничений?
Многие достижения в человеческом обществе были стимулированы доступом к новым и инновационным инструментам (например, печатный пресс или компьютер). Могут ли эти же выводы относиться к LLM? В этом обзоре мы изучим недавнее направление исследований, которое стремится научить LLM использовать внешние инструменты, которые доступны через простые API для текста. Используя эти инструменты, LLM могут делегировать задачи, такие как выполнение арифметических операций или поиск актуальной информации, специализированному инструменту. Затем информация, полученная от этого инструмента, может быть использована в качестве контекста LLM при генерации вывода, что приводит к более точным и обоснованным ответам.
![(из [1] и ChatGPT Plus)](https://miro.medium.com/v2/resize:fit:640/format:webp/0*R2NjIxyxXQCJQMtg.png)
Делаем LLM более способными
Дать LLM доступ к внешнему инструменту – надежный способ решить некоторые ограничения, с которыми эти модели сталкиваются. Однако LLM не будет знать, как использовать инструменты естественным образом, что вызывает вопрос: Как мы научим нашу модель использовать внешние инструменты? В этом разделе мы рассмотрим некоторые варианты и перечислим различные инструменты, которые полезны для создания приложений LLM.
Различные типы обучения

Обучение LLM использовать инструменты не отличается от обучения, как решать любую другую задачу с помощью LLM. Поскольку эти модели учатся несколькими различными способами, мы рассмотрим…
- Познакомьтесь с LegalBench совместно созданным открытым бенчмарком для оценки юридического рассуждения в англоязычных моделях большого объема на основе искусственного интеллекта.
- 40+ Крутых инструментов ИИ, которые стоит проверить (сентябрь 2023 года)
- Meta AI выпустила Code Llama современную модель большого языка для программирования