Исследователи из Университета Калифорнии в Сан-Диего (UCSD) опубликовали в открытый доступ Graphologue уникальную технику искусственного интеллекта, которая преобразует ответы больших языковых моделей, таких как GPT-4, в интерактивные диаграммы в режиме реального времени.

Ученые из Университета Калифорнии в Сан-Диего (UCSD) разработали Graphologue - уникальную технику искусственного интеллекта, которая преобразует ответы языковых моделей в интерактивные диаграммы в реальном времени.

Большие языковые модели (LLM) недавно приобрели огромную популярность благодаря их доступности и замечательной способности генерировать текстовые ответы на широкий спектр запросов пользователей. Более миллиарда людей использовали LLM, такие как ChatGPT, чтобы получить информацию и решения своих проблем. Эти LLM являются ключевыми инструментами во многих областях и имеют потенциал изменить способ выполнения информационных задач людьми.

Несмотря на их силу, LLM, такие как ChatGPT, имеют множество ограничений, когда речь идет о решении сложных информационных задач. Эти ограничения существуют из-за внутренних ограничений текстовых интерфейсов и линейных разговорных моделей. Как линейная последовательность символов, текст может быть непригодным для передачи сложных идей с сложными отношениями и структурами. Это часто приводит к излишне многословным комментариям, которые трудно полностью понять. Кроме того, линейная разговорная структура текстовых интерфейсов может затруднить выполнение задач, требующих нелинейного исследования, и может привести к тому, что пользователи должны следовать длинным и сложным диалогам.

Для преодоления этих ограничений команда исследователей провела формативное исследование с десятью добровольцами с основной целью понять трудности, с которыми пользователи сталкиваются при работе с LLM, особенно в ситуациях, связанных с сложными информационными задачами. Было обнаружено, что многословные ответы от интерфейсов LLM часто затрудняют пользователям немедленное понимание и взаимодействие с отображаемой информацией. Эта проблема становится особенно заметной во время выполнения сложных задач, при которых пользователи должны перемещаться по сложным деталям.

Команда разработала Graphologue, которая является уникальной техникой для преодоления этих проблем. Она была разработана с целью улучшения коммуникации между пользователями и LLM. Это достигается мгновенным преобразованием текстовых ответов, создаваемых LLM, в графические диаграммы. Основные характеристики и возможности Graphologue включают в себя:

  1. Он использует новые методики подсказок для выявления сущностей и отношений из текстовых ответов, создаваемых LLM. Это включает выделение важных текстовых компонентов и их организацию в графические представления.
  1. Используя данные, полученные из ответов LLM, система создает в режиме реального времени узлово-связные диаграммы, которые служат визуальными представлениями текста, что упрощает понимание сложных отношений и концепций для пользователей.
  1. Пользователи могут взаимодействовать с диаграммами не только пассивным просмотром. Графические представления можно активно взаимодействовать, и пользователи могут изменять компоновку и содержание в соответствии с их индивидуальными требованиями.
  1. На основе их взаимодействия с диаграммами пользователи Graphologue могут предоставлять контекстно-специфичные подсказки. Эти вопросы направляют LLM на предложение дополнительных сведений или объяснений, облегчая более глубокий и гибкий диалог.

После оценки команда сфокусировалась на преимуществах и недостатках сочетания ответов, создаваемых LLM, с диаграмматическими представлениями. Она также исследовала, как различные представления, включая текст, контуры и диаграммы, могут взаимодействовать друг с другом, чтобы помочь пользователям лучше понять содержимое, создаваемое LLM. Этот обзор также дал представление о потенциальных будущих направлениях взаимодействия с LLM с использованием графических интерфейсов. Основная цель – оценить производительность Graphologue, а также потенциал графики в целом для приложений LLM.

В заключение, Graphologue изменяет взаимодействие между людьми и LLM. Нелинейные разговоры, обеспечиваемые этим графическим методом, особенно полезны для деятельности, связанной с исследованием, организацией и пониманием знаний. Пользователи могут более легко перемещаться по информации, изменять графическое представление по мере необходимости и активно взаимодействовать с системой для лучшего понимания содержимого.