Эта статья об искусственном интеллекте знакомит с Lemur и Lemur Chat для гармонизации естественного языка и кода для языковых агентов.

Познакомьтесь с Lemur и Lemur Chat искусственный интеллект для гармонизации языка и кода в языковых агентах

В широком смысле, интеллектуальные агенты – это автономные решатели проблем, одаренные восприятием, суждением и способностями к действиям на основе данных, полученных из окружающей среды. Недавние приложения этой идеи показали надежду в развитии языковых агентов, которые могут использовать естественный язык для выполнения широкого спектра сложных задач в различных контекстах. Это особенно верно, когда эти агенты создаются с использованием больших языковых моделей (LLM). Агенты такого типа могут имитировать человеческую мысль и язык, потому что они используют человеческое экспертное знание в виде LLM. Это позволяет людям быть гибкими в использовании инструментов, адаптироваться к новым ситуациям, логически обосновывать и разрабатывать многоагентные системы на ходу.

LLM должны понимать человеческое взаимодействие, логическое мышление и планирование и обеспечивать привязку к необходимым контекстам для правильного построения основы языковых агентов. Естественные языковые возможности LLM позволяют им тесно имитировать человеческое общение, мышление и планирование. Однако выполнение на основе окружения обычно осуществляется с помощью общего кода или специализированных API, таких как использование веб-браузеров, взаимодействие с командным интерфейсом операционной системы и управление робототехническими манипуляторами.

Для заполнения этой пробела новое исследование университета Гонконга, XLang Lab, Salesforce Research, Sea AI Lab, Университет Вашингтона и MIT CSAIL представляют Лемура и Лемур-Чат, две передовые, общедоступные модели, которые были предварительно обучены и доучены для достижения гармонии между текстом и кодом. Благодаря тщательно разработанным процессам предварительного обучения и донастройки, исследователи улучшили исходную модель Ламма-2-70В. Чтобы обеспечить расширенные возможности в области программирования при сохранении возможностей в области естественного языка, был создан код-центрированный корпус на основе Stack, включающий 90 миллиардов маркеров с соотношением текст:код 10:1. Этот прототип известен как Лемур. Для создания модели, следующей инструкциям, Лемур-Чат, они сначала предварительно обучили ее, используя около 100 тысяч экземпляров из текста и кода. Лемур и Лемур-Чат доказали свою многосторонность после обширных экспериментов с 8 тестовыми заданиями на текстовое программирование.

Кроме того, данное исследование ставит целью определения стандартов агента для оценки основных компетенций языковых агентов в различных ситуациях. Особое внимание команда уделяет их навыкам работы с инструментами и способности укорениться в окружающей и социальной информации. Они также исследуют сложности, присущие реальным, частично видимым ситуациям, где агент должен действовать на основе неполной информации и выполнять дополнительные действия для заполнения пробелов. Эксперименты показывают, что Лемур-Чат показывает лучшие результаты в 12 из 13 агентских тестов в сравнении с другими моделями с открытым исходным кодом. Это показывает, как Лемур-Чат может превзойти существующие модели с открытым исходным кодом для языковых агентов, сочетая естественные и программные способности.

Результаты этих испытаний демонстрируют важность сочетания языковых и вычислительных навыков в среде на основе агентов. Модели, такие как Llama-2-70B-Chat, которые отличаются в обработке естественного языка, но испытывают затруднения в программировании, могут эффективно использовать базовые инструменты для помощи в рассуждении, поскольку пространство действий ограничено, а усилия по использованию таких инструментов незначительны. В отличие от этого, пространство действий обычно огромно при столкновении со сложными ситуациями принятия решений, такими как просмотр веб-страниц и навигация по дому, и у моделей с высокой возможностью программирования есть преимущество при построении сложных последовательностей действий. В целом, превосходная производительность Лемура обусловлена его способностью обработки естественного языка и программирования. Это исследование заложило основу для создания сложных языковых агентов, которые могут эффективно работать в широком спектре ситуаций, освещая оптимизацию синергии между естественными и программными языками.