Исследователи из Университета Калифорнии в Сан-Диего (UCSD) опубликовали в открытый доступ Graphologue уникальную технику искусственного интеллекта, которая преобразует ответы больших языковых моделей, таких как GPT-4, в интерактивные диаграммы в режиме реального времени.
Ученые из Университета Калифорнии в Сан-Диего (UCSD) разработали Graphologue - уникальную технику искусственного интеллекта, которая преобразует ответы языковых моделей в интерактивные диаграммы в реальном времени.
Большие языковые модели (LLM) недавно приобрели огромную популярность благодаря их доступности и замечательной способности генерировать текстовые ответы на широкий спектр запросов пользователей. Более миллиарда людей использовали LLM, такие как ChatGPT, чтобы получить информацию и решения своих проблем. Эти LLM являются ключевыми инструментами во многих областях и имеют потенциал изменить способ выполнения информационных задач людьми.
Несмотря на их силу, LLM, такие как ChatGPT, имеют множество ограничений, когда речь идет о решении сложных информационных задач. Эти ограничения существуют из-за внутренних ограничений текстовых интерфейсов и линейных разговорных моделей. Как линейная последовательность символов, текст может быть непригодным для передачи сложных идей с сложными отношениями и структурами. Это часто приводит к излишне многословным комментариям, которые трудно полностью понять. Кроме того, линейная разговорная структура текстовых интерфейсов может затруднить выполнение задач, требующих нелинейного исследования, и может привести к тому, что пользователи должны следовать длинным и сложным диалогам.
Для преодоления этих ограничений команда исследователей провела формативное исследование с десятью добровольцами с основной целью понять трудности, с которыми пользователи сталкиваются при работе с LLM, особенно в ситуациях, связанных с сложными информационными задачами. Было обнаружено, что многословные ответы от интерфейсов LLM часто затрудняют пользователям немедленное понимание и взаимодействие с отображаемой информацией. Эта проблема становится особенно заметной во время выполнения сложных задач, при которых пользователи должны перемещаться по сложным деталям.
- ReLU против Softmax в Vision Transformers имеет ли значение длина последовательности? Инсайты из исследовательской работы Google DeepMind
- Исследователи из Токийского университета представляют новую технику защиты чувствительных приложений на основе искусственного интеллекта от атакующих.
- Это исследование по искусственному интеллекту представляет собой Owl новую большую языковую модель для IT-операций.
Команда разработала Graphologue, которая является уникальной техникой для преодоления этих проблем. Она была разработана с целью улучшения коммуникации между пользователями и LLM. Это достигается мгновенным преобразованием текстовых ответов, создаваемых LLM, в графические диаграммы. Основные характеристики и возможности Graphologue включают в себя:
- Он использует новые методики подсказок для выявления сущностей и отношений из текстовых ответов, создаваемых LLM. Это включает выделение важных текстовых компонентов и их организацию в графические представления.
- Используя данные, полученные из ответов LLM, система создает в режиме реального времени узлово-связные диаграммы, которые служат визуальными представлениями текста, что упрощает понимание сложных отношений и концепций для пользователей.
- Пользователи могут взаимодействовать с диаграммами не только пассивным просмотром. Графические представления можно активно взаимодействовать, и пользователи могут изменять компоновку и содержание в соответствии с их индивидуальными требованиями.
- На основе их взаимодействия с диаграммами пользователи Graphologue могут предоставлять контекстно-специфичные подсказки. Эти вопросы направляют LLM на предложение дополнительных сведений или объяснений, облегчая более глубокий и гибкий диалог.
После оценки команда сфокусировалась на преимуществах и недостатках сочетания ответов, создаваемых LLM, с диаграмматическими представлениями. Она также исследовала, как различные представления, включая текст, контуры и диаграммы, могут взаимодействовать друг с другом, чтобы помочь пользователям лучше понять содержимое, создаваемое LLM. Этот обзор также дал представление о потенциальных будущих направлениях взаимодействия с LLM с использованием графических интерфейсов. Основная цель – оценить производительность Graphologue, а также потенциал графики в целом для приложений LLM.
В заключение, Graphologue изменяет взаимодействие между людьми и LLM. Нелинейные разговоры, обеспечиваемые этим графическим методом, особенно полезны для деятельности, связанной с исследованием, организацией и пониманием знаний. Пользователи могут более легко перемещаться по информации, изменять графическое представление по мере необходимости и активно взаимодействовать с системой для лучшего понимания содержимого.