Google Cloud и NVIDIA повышают сотрудничество на новый уровень

Google Cloud и NVIDIA усиливают сотрудничество

По мере того как генеративное искусственное интеллекта и большие языковые модели (LLM) продолжают способствовать инновациям, требования к вычислениям для обучения и вывода растут с поразительной скоростью.

Для удовлетворения этой потребности Google Cloud сегодня объявил о начале общедоступности новых экземпляров A3, оснащенных графическими процессорами NVIDIA H100 Tensor Core. Эти графические процессоры обеспечивают беспрецедентную производительность для всех видов приложений искусственного интеллекта благодаря своему трансформаторному движку, специально разработанному для ускорения LLM.

Наличие экземпляров A3 следует за объявлением NVIDIA о назначении ее партнером генеративного искусственного интеллекта года Google Cloud. Эта награда признает глубокое и продолжающееся сотрудничество компаний в области ускорения генеративного искусственного интеллекта на платформе Google Cloud.

Совместное усилие принимает несколько форм, начиная от проектирования инфраструктуры до обширного программного обеспечения, чтобы облегчить создание и развертывание приложений искусственного интеллекта на платформе Google Cloud.

На конференции Google Cloud Next основатель и CEO NVIDIA Дженсен Хуанг вместе с CEO Google Cloud Томасом Курианом приняли участие в ключевом докладе мероприятия, посвященном празднованию общедоступности экземпляров A3, работающих на графических процессорах NVIDIA H100, и рассказали о том, как Google использует графические процессоры NVIDIA H100 и A100 для внутренних исследований и вывода в своих подразделениях, включая DeepMind.

Во время обсуждения Хуанг указал на более глубокий уровень сотрудничества, который позволил ускорение графическими процессорами NVIDIA для фреймворка PaxML для создания масштабных LLM. Этот машинный обучение фреймворк на основе Jax специально разработан для обучения моделей большого масштаба, позволяя проводить передовые и полностью настраиваемые эксперименты и параллельное выполнение.

Google использовала PaxML для создания внутренних моделей, включая DeepMind, а также для исследовательских проектов, и будет использовать графические процессоры NVIDIA. Компании также объявили, что PaxML доступен немедленно в реестре контейнеров NVIDIA NGC.

Многочисленные генеративные стартапы

На сегодняшний день существует более тысячи генеративных стартапов, создающих приложения следующего поколения, многие из которых используют технологию NVIDIA на платформе Google Cloud. Некоторые известные компании в этой сфере включают Writer и Runway.

Writer использует LLM на основе трансформаторов для быстрого создания текстов для веб-страниц, блогов, рекламы и т. д. Для этого компания использует NVIDIA NeMo, фреймворк приложений от NVIDIA AI Enterprise, который помогает компаниям создавать и настраивать свои наборы данных для обучения, создавать и настраивать LLM и запускать их в производстве в масштабе.

Используя оптимизации NeMo, разработчики Writer перешли от работы с моделями с сотнями миллионов параметров к моделям с 40 миллиардами параметров. Среди клиентов стартапа такие известные компании, как Deloitte, L’Oreal, Intuit, Uber и множество других компаний из списка Fortune 500.

Runway использует искусственный интеллект для создания видео в любом стиле. Модель искусственного интеллекта имитирует определенные стили, основанные на заданных изображениях или текстовом запросе. Пользователи также могут использовать модель для создания нового видеоконтента, используя существующие материалы. Это позволяет режиссерам и создателям контента исследовать и проектировать видео совершенно новым способом.

Google Cloud был первым поставщиком облачных услуг, предлагающим графический процессор NVIDIA L4. Кроме того, компании сотрудничали для того, чтобы Google Dataproc мог использовать ускоритель RAPIDS для Apache Spark, что позволяет значительно повысить производительность ETL. Эта возможность доступна сегодня с использованием Dataproc на Google Compute Engine и вскоре будет доступна для Serverless Dataproc.

Компании также предоставили доступ к NVIDIA AI Enterprise на Google Cloud Marketplace и интегрировали программное обеспечение ускорения NVIDIA в среду разработки Vertex AI.

Получите дополнительные сведения о графических процессорах NVIDIA на платформе Google Cloud и о том, как NVIDIA обеспечивает работу генеративного искусственного интеллекта, и узнайте, как организации выполняют свои критически важные корпоративные приложения с помощью NVIDIA NeMo на графически ускоренном Google Cloud.

Подпишитесь на новости о генеративном искусственном интеллекте, чтобы быть в курсе последних достижений, разработок и технологий.