Момент ‘ChatGPT’ для робототехники стал ближе, чем когда-либо, благодаря Google

Google приближает момент 'ChatGPT' для робототехники больше, чем когда-либо

Google’s RT-X Робот здесь

Фото от Andy Kelly на Unsplash

Можно смело сказать, что Google Deepmind является для робототехники то же самое, что OpenAI для Large Language Models.

И, несмотря на то, что робототехника на основе ИИ вызывает столько же страха, сколько и гипе, из-за навязчивой идеи человечества создавать высокоинтеллектуальные ИИ модели, олицетворяющиеся в физическом мире, на этой неделе мы увидели доказательство того, что этот область постепенно приближается к своему “моменту ChatGPT”.

Вам это нравится или нет.

И их новые модели, семейство RT-X, свидетельствуют о том, что ИИ достиг точки без возврата.

Эта статья была опубликована несколько дней назад в моем бесплатном еженедельном рассылке, TheTechOasis.

Если вы хотите быть в курсе событий во взволнованном мире ИИ, а также чувствовать вдохновение к действию или, по крайней мере, быть хорошо подготовленным к будущему перед нами, это для вас.

🏝Подпишитесь ниже🏝, чтобы стать лидером ИИ среди своих коллег и получать контент, отсутствующий в любой другой платформе, включая VoAGI:

Подписаться | TheTechOasis

Рассылка, чтобы оставаться впереди в AI

thetechoasis.beehiiv.com

Множественный предсказатель движений тела

Несколько месяцев назад я писал о RT-2, тогдашней передовой роботизированной руке Google Deepmind.

RT-2, универсальная рука

Эта модель, первая своего рода, была моделью VLA (Vision-Language-Action), которая, получив видеокадр и инструкцию, предсказывала движения, необходимые от актуатора для выполнения инструкции, на основе наблюдений с камеры, прикрепленной к роботу.

Источник: Google Deepmind

По архитектуре модель включала Визионный Трансформер и LLM.

Первый обрабатывал изображение, а второй текст, оба кодируя свои соответствующие входы в общее пространство встроенных…