Могут ли большие языковые модели действительно действовать и рассуждать? Исследователи из Университета Иллинойс в Урбана-Шампейне представляют LATS для улучшения процесса принятия решений.

Выявление способности больших языковых моделей к рассуждению и принятию решений исследование университета Иллинойса в Урбана-Шампейне и их разработка LATS для оптимизации принятия решений.

ЛЛМ-ы (лингвистически-логические модели) доказали свою ценность в задачах логического и принятия решений. Они отлично справляются с разбиением сложных проблем на последовательные шаги, но их производительность можно улучшить с помощью методов, таких как самоконсистентность и многошаговое разложение. ЛЛМ-ы также эффективны для принятия решений в различных областях, хотя часто сталкиваются с трудностями в адаптации к динамическим средам. Используя методы поиска на основе деревьев, такие как поиск по дереву Монте-Карло (MCTS), LATS усиливает способности ЛЛМ-ов в исследовании и использовании альтернатив, устраняя необходимость в отдельном тренинге функции ценности.

Автономные агенты, способные к логическому мышлению и принятию решений, являются значительным фокусом в области искусственного интеллекта. Традиционное обучение с подкреплением было основным методом, но ЛЛМ-ы предоставляют альтернативу. ЛЛМ-ы отлично справляются с задачами логического мышления и адаптируемости, включая обработку естественного языка и сложные среды. Техники стимулирования улучшают их способности, но часто у них не хватает взвешенного принятия решений.

Исследователи из Университета Иллинойса в Урбане-Шампейне представляют LATS, структуру, которая использует возможности ЛЛМ-ов для принятия решений, планирования и логического мышления. LATS переориентирует ЛЛМ-ы в качестве агентов, функций ценности и оптимизаторов. Он использует MCTS для исследования разных путей принятия решений и интегрирует внешнюю обратную связь для адаптивного решения проблем. Экспериментальные оценки демонстрируют широкую применимость LATS, достигая высоких результатов в различных областях, включая программирование и веб-переход со ЛЛМ-ами, такими как GPT-4 и GPT-3.5.

LATS продемонстрировал свою универсальность и эффективность через обширные экспериментальные оценки в различных областях, таких как программирование, HotPotQA и WebShop. LATS продемонстрировал поразительную 94,4% успешность в программировании на HumanEval с использованием GPT-4. Для веб-перехода на WebShop он достиг впечатляющего среднего балла в 75,9 с использованием GPT-3.5, демонстрируя свою широкую применимость. Полученные результаты подчеркивают LATS как многообещающую структуру для улучшения автономного принятия решений с использованием ЛЛМ-ов. Доступные источники фокусируются на введении и оценке эффективности структуры, поэтому требуется больше информации о возможных ограничениях.

В заключение, данное исследование представляет LATS – структуру, которая интегрирует различные аспекты ЛЛМ-ов для улучшения принятия решений. LATS преодолевает предшествующие ограничения, интегрируя алгоритмы поиска, внешнюю обратную связь и опытное обучение. Экспериментальные оценки в различных областях демонстрируют эффективность LATS, подчеркивая его универсальность для автономного принятия решений без дополнительного обучения. Предлагаемые синергии внутри LATS обещают прогресс в развитии универсальных агентов. Дальнейшие исследования и анализ необходимы для выявления ограничений и областей для улучшения применения структуры LATS в автономном логическом мышлении и принятии решений.