Открытый день разработчиков OpenAI 2023 Четыре крупных анонса из ключевого доклада основателя Сэма Альтмана, которые вам стоит не пропустить!

Открытый день разработчиков OpenAI 2023 Четыре главных анонса из ключевого доклада основателя Сэма Альтмана, которые необходимо узнать!

От обновлений до ChatGPT, введение GPT-4 Turbo, Custom GPTs и GPT store, Assistants API, пересмотренная ценовая политика моделей, улучшенный вызов функций, встроенный поиск и многое другое.

Первая конференция разработчиков OpenAI была полна удивительных анонсов продуктов. Что может быть еще интереснее???

Эти анонсы сделают множество стартапов искусственного интеллекта совершенно устаревшими. В крикете мы называем это «удаляющим стражу».

За одинчасовой доклад удалось “исчистить” столько стартапов и их ценности. Не правда ли, это мечта?! Или, позвольте сказать, кошмар!

Погрузитесь, чтобы узнать больше об анонсах продуктов и моеми 🌶️🌶️🌶️ выводами!!!

1. GPT-4 Turbo

Увеличенное контекстное окно

  • С увеличенным контекстным окном размером 128k, обновленным временным запоминанием знаний до апреля 2023 года и возможностью просмотра интернета, он может вместить 300 страниц типичного учебника в одно задание. Для быстрого сравнения, GPT-4 поддерживал контекстное окно размером 8k. От 8k до 128k, это огромно!!!!

Режим JSON в ответах модели

  • Вы можете включить JSON-режим, чтобы запрашивать модель вернуть ответ в формате JSON и легко вызывать внешний API приложений. Больше не нужно пытаться научить модель отвечать в формате JSON и использовать другие слова.
  • Вы можете вызывать несколько функций из одного задания.
  • Доступ к воспроизводимым выходным данным модели осуществляется путем настройки параметра seed.
  • Вы также можете видеть вероятности появления всех токенов в ответе от API.

Мультимодальные возможности

  • DALL-E 3 может програмно генерировать изображения
  • GPT-4 Turbo с Vision может принимать изображения в качестве входных данных через API
  • В аудио API TTS предоставляется конечная точка Text-to-Speech с 6 встроенными голосами, и звучит очень естественно
  • Была анонсирована Whisper V3, модель автоматического распознавания речи с открытым исходным кодом. Она скоро станет доступной в API, – сказал Альтман.

Настройка модели

  • Настройка модели основы – это одновременно искусство и наука. Или, позвольте мне назвать это колдовством?
  • Команда OpenAI будет сотрудничать с компаниями, чтобы помочь им настроить модели GPT для конкретных областей и наборов данных.
  • Доступ к опытной настройке GPT-4 также открыт. Зарегистрируйтесь, если хотите получить доступ.
  • OpenAI удвоила количество токенов в минуту для всех пользователей GPT-4
  • Авторский щит предназначен для защиты клиентов GPT-4 в юридическом аспекте, если они сталкиваются с проблемами авторских прав при использовании моделей GPT. В то время как свобода творчества художников и авторские права требуют обновления благодаря искусственному интеллекту, это интересный подход, и посмотрим, как он будет развиваться по мере зрелости области.

Ценообразование

  • Похоже, что модель GPT-4 Turbo будет в среднем в 2,75 раза дешевле, что поощряет пользователей использовать эту модель вместо предыдущих.

2. Обновления в chatGPT

  • chatGPT теперь использует GPT-4 Turbo
  • Он может просматривать веб-страницы через Bing.
  • Во время чата вам не нужно выбирать модель с помощью выпадающего списка. Исходя из вводной подсказки, chatGPT знает, какую модель вызвать и когда.

3. GPTs и GPT Store

  • GPTs – это настроенные версии chatGPT для разных областей и использования.
  • Это эволюция плагинов chatGPT. Вы можете создать пользовательскую версию chatGPT с инструкциями, расширенным поиском знаний и действиями.
  • Команда OpenAI проснулась и выбрала насилие. Ну, я имею в виду, не в прямом смысле. Или, может быть, в прямом смысле. Сколько стартапов сегодня обанкротилось?! Стоит ли считать?
  • “Prompt Engineering”, “Retrieval Augmented Generation” и создание ИИ-приложений путем объединения разных вызовов API с использованием LangChain или подобных библиотек были самыми популярными подходами к созданию ИИ-приложений.

С расширенным поиском знаний, улучшенными функциями вызова и API ассистентов от OpenAI, множество инструментов в так называемом «LLM-стеке» потеряли свою ценность. Темпы развития отрасли необусловленные!!!! Просто страшно и одновременно увлекательно!!

  • GPT Builder позволяет писать вводные подсказки на естественном языке, которые генерируют пользовательские GPT и для вас. Больше не нужно заниматься подготовкой вводных данных, работой с векторными базами данных и записывать код для создания чат-ботов.
  • Один ИИ-агент создает несколько ИИ-агентов. Ну что ж, мы на пути создания заводов по производству ИИ, ха-ха.
  • TutorGPT, WriterGPT, ResumeGPT, ThisGPT, ThatGPT и каждый другой инструмент, который был оболочкой вокруг GPT, теперь могут быть созданы с помощью естественного языка. Дико, не правда ли?!

Магазин GPT

  • После создания пользовательских GPT вы можете опубликовать их для использования в магазине GPT. Это онлайн-рынок для разных приложений и будет отличным ресурсом для компаний, у которых нет специалистов по искусственному интеллекту для создания индивидуальных решений.
  • Это сделает принятие ИИ в бизнесе намного проще. Даже компании, которые находятся в неравных условиях из-за отсутствия внутрикорпоративных экспертов по ИИ, смогут ощутимо воспользоваться этим преимуществом.
  • Деление доходов с создателями GPT может означать появление большого количества однофирменных ИИ-компаний, которые зарабатывают большие деньги. А будут ли однофирменные ИИ-единороги становиться реальностью теперь? Или я слишком сильно полагаюсь на план совместного использования прибыли OpenAI? Давайте подождем и посмотрим!!!!
  • Ой, а безопасность GPT, опубликованных в магазине, как насчет нее? Альтман говорит, что будет проводиться тщательный отбор, чтобы опубликовать эти GPT в магазине.
  • А что будет с уже существующими версиями GPT, например, ChaosGPT?

4. Assistants API

  • API ассистентов упрощает создание чат-ботов и агентских интерфейсов. Больше не нужно мучаться с векторными базами данных, частными случаями использования и цепочкой вызовов API с использованием отдельного инструмента, полагаясь на архитектуру RAG (Retrieval Augmented Generation) и так далее.
  • Одно из самых важных применений моделей LLM – создание чат-ботов для разных областей.
  • API ассистентов поддерживает постоянные потоки, что означает больше проблем с управлением состоянием, подсказками и контекстом.

Он поставляется с встроенным поиском для дополнения модели внешними хранилищами знаний. Вам не нужно вычислять векторные представления для документов базы знаний, больше не нужно хранить их в векторной базе данных или реализовывать умный алгоритм фрагментации. Какая крутая штука, не правда ли? Больше нет необходимости в RAG.

  • За последние несколько месяцев каждая технологическая компания, которую вы только знаете, выпустила своего собственного ассистента LLM и называет их всеми возможными фантазийными двухсложными английскими именами. Если только это не Microsoft, и chatGPT знает, как он будет называться 😂😂😂

Интерпретатор Python

  • Помните в первые дни безумия chatGPT, когда некоторые из нас подумали, что в chatGPT должна быть встроена linux VM? Потому что, когда мы запускали несколько команд Linux во входной строке, он генерировал невероятно правильные результаты для этих команд. Единственным возможным объяснением было то, что chatGPT запускал наши команды на VM и возвращал результаты. Как иначе большая языковая модель может давать идеальные результаты при выполнении Linux-команд?!!!

Итак, команда OpenAI догнала наши фантазии и решила добавить интерпретатор кода, который может выполнять код Python в окружении с ограниченными возможностями. Он может создавать графики, выполнять анализ данных, генерировать код Python для решения математических и логических задач и многое другое.

  • Это так круто, но это также будет способствовать появлению больше вопросов/исследований в направлении “О, chatGPT теперь может делать рассуждения”.
  • Демонстрация на примере показывает, как chatGPT смог выполнить простую математику по разделению расходов между друзьями, конвертированию обменных курсов и расчету общих расходов поездки в Париж. Но сможет ли он решить Мир блоков? Что ж, это не моя проблема, это ваша проблема (глядя на вас, исследователи Символической ИИ!!😅)

Резюме

API ассистентов – это переломный момент для организаций, а GPT Store – это переломный момент для разработчиков. Поехали строить!

Вы также можете посмотреть полную презентацию.

Спасибо за чтение!

Если вам нравится моя работа и вы хотите поддержать меня…

  1. Лучший способ поддержать меня – это подписаться на меня в VoAGI.
  2. Для передачи наилучших практик в области обработки данных и советов по Python для начинающих, следуйте за мной в LinkedIn.
  3. Не стесняйтесь похлопать, чтобы я знал, насколько полезен был этот пост для вас.

Stackademic

Спасибо, что дочитали до конца. Перед тем, как уйти:

  • Рассмотрите возможность похлопать и подписаться на автора! 👏
  • Подпишитесь на нас в Twitter(X), LinkedIn и YouTube.
  • Посетите Stackademic.com, чтобы узнать больше о том, как мы демократизируем свободное программное обучение по всему миру.