Майкрософт представляет Orca2, создавая первого осторожного рассуждающего LLM

Microsoft представляет Orca2 первый осторожно размышляющий LLM

Прорыв в рассуждении

Как мы обсуждали на прошлой неделе, маленькие языковые модели (SLM) сейчас на пике популярности.

Кроме того, Microsoft запустил новую версию своей самой значимой SLM, Orca2, создав новый тип языковой модели, осторожные рассуждающие.

Они установили новый порог в индустрии искусственного интеллекта, победив модели в десять раз более объемные в сложных задачах рассуждения.

Кроме того, они предоставили ясное представление о своей стратегии в области искусственного интеллекта, а также бесценные идеи в сложном мире обучения Transformer.

Сегодня мы глубоко погрузимся в то, как они создали эту новую парадигму.

Большинство идей, которыми я делюсь в VoAGI, ранее были представлены в моем еженедельном информационном бюллетене, TheTechOasis.

Если вы хотите быть в курсе событий в беспокойном мире искусственного интеллекта, а также получать вдохновение для принятия мер или, по крайней мере, быть хорошо подготовленным к будущему перед нами, это для вас.

🏝 Подпишитесь ниже 🏝, чтобы стать лидером в области искусственного интеллекта среди своих коллег и получать контент, который не представлен на других платформах, включая VoAGI:

Подписаться | TheTechOasis

Информационный бюллетень для опережения развития в области искусственного интеллекта

thetechoasis.beehiiv.com

Игра в имитацию

Когда Microsoft представил первую версию Orca, первую модель с открытым исходным кодом, действительно на уровне ChatGPT-3.5, индустрия искусственного интеллекта, наконец, начала обращать внимание на более маленькие модели.

Сегодня оригинальная модель Orca не только рассматривается как важное нововведение, но она также является основой стратегии Microsoft, поскольку слухи говорят, что LLM, работающая за кулисами Microsoft’s Copilots, разговора всей индустрии, это не ChatGPT, а Orca, из-за невероятных затрат на запуск моделей с более чем 100 миллиардами параметров.

Принцип Microsoft прост: если мы можем получить модель, которая предоставляет нам 90% возможностей более крупной модели по стоимости в 10 раз меньше, мы выберем этот путь.