Исследователи Google представляют Universal Self-Consistency (USC) новый прорыв в возможностях крупных моделей языка для выполнения сложных задач

Новый прорыв в возможностях крупных моделей языка Universal Self-Consistency (USC) – представление от исследователей Google для выполнения сложных задач

Проблема выбора наиболее последовательного ответа из нескольких кандидатов для улучшения результатов работы, особенно в задачах математического рассуждения и генерации кода, была исследована сотрудниками Google с использованием их метода Universal Self-Consistency (USC). Этот метод использует LLM (языковые модели с ограниченным вниманием) и достигает сопоставимых результатов с обычным самоконсистентностью, не требующей одинакового формата ответов или доступа к результатам выполнения.

Переоценка улучшает генерацию языковых моделей путем выборки выходных данных и применения пост-факторных критериев. LLM-модели оценивают сгенерированные моделью тексты без человеческих ссылок. Предложенный метод USC работает сопоставимо с обычной самоконсистентностью, не требуя дополнительных размеченных данных или внешней модели переоценки.

LLM-модели превосходят в задачах математического рассуждения и генерации кода. Предыдущие подходы улучшают качество вывода LLM-моделей путем выборки и отбора на основе критериев. Самоконсистентность эффективна для задач с уникальными ответами, но испытывает трудности в открытой эпохе. Метод USC использует LLM-модели для выбора наиболее последовательного ответа из нескольких кандидатов. Как показано на разнообразных бенчмарках, USC, устраняя извлечение ответа, позволяет эффективно улучшить генерацию задач открытого типа.

Метод USC использует LLM-модели для выбора наиболее последовательного ответа из нескольких кандидатов, устраняя необходимость извлечения ответа. USC расширяет самоконсистентность на задачи свободной генерации, оцениваемые на бенчмарках, таких как математическое рассуждение, генерация кода, резюмирование и открытый вопросно-ответный формат. Подход генерирует несколько примеров с использованием LLM-моделей и выбирает ответ на основе последовательности.

Метод USC демонстрирует свою эффективность в задачах генерации открытого типа, превосходя ограничения первоначального подхода самоконсистентности. USC соответствует обычной самоконсистентности в задачах математического рассуждения с разными форматами ответов и не требует выполнения кода для генерации кода. USC последовательно улучшает результаты по сравнению с базовым уровнем в задачах с длинным контекстом и достигает наивысших показателей достоверности и информативности в бенчмарке TruthfulQA. Работа USC стабильна при различных порядках ответов, выигрывает от большего числа примеров в некоторых задачах и может быть дополнительно улучшена с помощью незначительных задачно-специфических адаптаций.

В заключение, метод USC доказал свою высокую эффективность для задач свободной генерации, постоянно превосходя базовый уровень в задачах с длинным контекстом резюмирования и вопросно-ответного формата открытого типа. Его использование LLM-моделей для выбора наиболее последовательного ответа из нескольких кандидатов продемонстрировало значительное улучшение в различных приложениях, включая задачи математического рассуждения и генерации кода, без необходимости использования подобных форматов ответов или фактических результатов выполнения. USC является ценным инструментом для создания точных и надежных ответов в различных контекстах.