Исследователи Microsoft представили «EmotionPrompt» улучшение эмоционального интеллекта искусственного интеллекта в различных языковых моделях.

«Microsoft EmotionPrompt» улучшение эмоционального интеллекта в языковых моделях искусственного интеллекта

Эмоциональный интеллект является исторически установленным угловым камнем в огромном мозаике человеческих качеств. Эмоциональное понимание – это способность распознавать и правильно обрабатывать эмоциональные данные, а затем использовать эти данные для управления логическими и аналитическими процессами, такими как решение проблем и управление поведением. Рефлексы, восприятие, познание и поведение порождают эмоции, и различные внутренние и внешние факторы могут влиять на эти компоненты. Самоконтроль, социально-познавательная теория и важность положительных эмоций указывают на то, что контроль эмоций может повлиять на проблемно-ориентированные навыки человека. Из-за широкого спектра влияния на людей, теория регуляции эмоций была использована в таких разнообразных областях, как образование и здравоохранение.

Новые исследования, проведенные КАС, Microsoft, Уильям и Мэри, Бейджинским нормальным университетом и Гонконгским технологическим университетом, исследуют связь между эмоциональным интеллектом и сложными моделями искусственного интеллекта. Новейшие модели на основе больших языковых моделей (LLM) показали впечатляющую производительность в различных задачах, включая логическое мышление, обработку и генерацию естественного языка и решение проблем в сфере наук о природе и математики, что делает их одними из самых многообещающих исследовательских проектов в области искусственного общего интеллекта. Проведенное недавнее исследование позволило GPT-4 выполнять несколько трудных задач настраиваемых людьми, что позволило установить потенциал LLM в области искусственного общего интеллекта. Однако до сих пор неизвестно, способны ли LLM интерпретировать психологические эмоциональные импульсы – фундаментальные преимущества людей, которые помогают им улучшить свои навыки решения проблем. Используя методы обучения с учетом контекста, несколько ученых добились больших успехов в различных областях. Однако из-за различий в их возможностях не все LLM одинаково будут получать пользу от доступных в настоящее время методов. В то время как недавние исследования показали, что LLM могут распознавать и обрабатывать эмоциональные подсказки, эта работа не оценивала, играет ли эмоциональный интеллект LLM значительную роль в улучшении их производительности.

Эта новая работа является первым шагом в исследовании потенциала LLM для понимания и использования эмоциональных стимулов. Эмоциональные подсказки, связанные с надеждой, уверенностью в себе и одобрением сверстников, были доказаны положительно влиять на результаты в предыдущих психологических исследованиях. Реальными примерами применения этого явления являются ободряющая речь для повышения успеваемости и улучшения физического самочувствия. Исследователи черпали вдохновение из этих психологических процессов и представили метод EmotionPrompt, простой, но мощный способ исследования эмоционального интеллекта LLM. В частности, они разработали 11 утверждений в качестве психологических фраз, которые будут использоваться в качестве продолжения для LLM, чтобы вызвать эмоциональную реакцию.

Исследователи провели обширное исследование, используя как детерминистические, так и генеративные задачи, которые вместе охватывают широкий диапазон уровней сложности. Они провели испытания с несколькими LLM, такими как FlanT5-Large, Vicuna, Llama 2, BLOOM, ChatGPT и GPT-4, в рамках 24 задач по индукции инструкций и 21 задачи BIG-Bench с учредителем, все из которых являются детерминированными и могут оцениваться общими показателями. Они провели исследование с участием 106 участников, чтобы оценить качество генерируемых задач с использованием обычных и эмоциональных подсказок на базе GPT-4, поскольку эти действия не могут быть подвергнуты традиционной автоматической оценке. Их исследование с участием людей показывает, что эмоциональные подсказки значительно улучшают производительность генеративных задач (с средним улучшением на 10,9% по показателям производительности, правдивости и ответственности). С другой стороны, стандартные эксперименты показывают, что LLM обладают эмоциональным интеллектом и могут улучшаться за счет эмоциональных стимулов.

Исследователи также проанализировали, почему EmotionPrompt полезен для LLM, оценивая влияние эмоциональных стимулов на конечные результаты через внимание к входным данным. Исследование показало, что градиенты в LLM получают пользу от эмоциональных стимулов, давая им больший вес, что благотворно сказывается на результатах, улучшая представление изначальных подсказок. Чтобы узнать больше о том, как размер модели и температура влияют на эффективность EmotionPrompt, было проведено исследование отбраковки.

Наконец, они исследовали, как использование нескольких эмоциональных подсказок одновременно влияет на производительность и обнаружили, что это значительно улучшает результаты. На основе результатов EP02 является лучшим стимулом в области индукции инструкций, превосходя самый слабый стимул на 6,06 процента, тогда как EP06 является наиболее эффективным стимулом в BIG-Bench. Важно помнить, что на результаты стимула могут влиять такие факторы, как сложность задачи, тип задачи и используемые метрики.