Почему LLaVa-1.5 – великая победа для открытого искусственного интеллекта

LLaVa-1.5 Великолепная победа открытого искусственного интеллекта

Война переходит в мультимодальность

Фото от svklimkin на Unsplash

Я много раз говорил о войне ИИ между открытыми и приватными моделями, но результаты кажутся одинаковыми.

Открытые исходники кажутся замечательными и полными обещаний, но часто являются просто мечтаниями и непрактичностью.

Теперь, возможно, что-то изменилось.

Источник: Dall-e3

Microsoft, совместно с университетами Уисконсин-Мэдисон и Колумбия, представил новую версию модели LLaVa – LLaVa-1.5.

LLaVa, одна из первых действительно эффективных Крупных Мультимодальных Моделей (KММ), была модернизирована, и результаты впечатляют, учитывая, что она в сотни раз меньше моделей, таких как GPT-4 Vision, недавнего релиза OpenAI, который шокирует мир.

Недавно опубликованная статья не только дает нам огромное представление о том, как строятся передовые мультимодальные модели, но и умудряется доказать ошибку всей отрасли.

Да, все были неправы по поводу открытых исходников, включая меня самого.

Эта статья была опубликована несколько дней назад в моей бесплатной еженедельной рассылке, TheTechOasis.

Если вы хотите быть в курсе событий в мире ИИ, чувствовать вдохновение для действий или, по крайней мере, быть хорошо подготовленным к нашему предстоящему будущему – это для вас.

🏝Подпишитесь ниже🏝 чтобы стать лидером ИИ среди своих коллег и получать контент, которого нет на других платформах, включая VoAGI:

Подписаться | TheTechOasis

Рассылка для того, чтобы быть впереди в ИИ

thetechoasis.beehiiv.com

О, мое сладкое, сладкое прививание

Прежде всего, нужно прояснить, что такое мультимодальность, так как это слово часто используется безразлично.

Что на самом деле является мультимодальностью