CogVLM, революционная мультимодальная модель, внедряющая глубокое слияние

CogVLM революционная мультимодальная модель, устраивающая глубокое слияние

Решение проблемы неглубокого выравнивания

Группа исследователей представила новую модель, которая революционизирует текущие стандарты дизайна мультимодального AI, превосходя почти всех конкурентов.

Они представляют инновационную концепцию, Deep Fusion, новый примитив дизайна, который смягчает самую крупную проблему, с которой сталкиваются сегодня Мультимодальные модели большого размера (MLLMs), – “проблема неглубокого выравнивания”.

Если бы модель CogVLM смогла использовать свой потенциал, она могла стать важным научным исследованием, которое привлечет внимание исследователей со всего мира к созданию новой семьи MLLMs, моделей глубокого слияния.

Фактические результаты? Впечатляющие возможности, такие как написание математических проблем с использованием изображений и многие другие, о которых мы скоро узнаем.

Но прежде всего, что такое проблема неглубокого выравнивания?

Большинство идей, которые я делюсь в VoAGI, ранее были представлены в моем еженедельном информационном бюллетене, TheTechOasis.

Если вы хотите быть в курсе френетического мира искусственного интеллекта, вдохновляться, чтобы принять меры или, по крайней мере, быть хорошо подготовленными к грядущему будущему, это для вас.

🏝Подписывайтесь ниже🏝, чтобы стать лидером ИИ среди своих коллег и получать контент, отсутствующий в любых других платформах, включая VoAGI:

Подписаться | TheTechOasis

Информационный бюллетень, чтобы быть впереди кривой в AI

thetechoasis.beehiiv.com

Это не могло быть так просто

Построение LLM – сложная задача.

Вам понадобятся огромный набор данных текстовых документов, команда мирового класса исследователей и мощный кластер GPU. Другими словами, вам нужно “много денег”… и талант.

И если вы хотите сделать свою модель коммерчески доступной, вам нужно научить ее, что говорить или не говорить.