Google представляет облако TPU v5p и AI Hypercomputer скачок в области обработки искусственного интеллекта.

Google презентует облачный TPU v5p и искусственный интеллект Hypercomputer революционный прорыв в области обработки данных

Google сделал шум с выпуском своей тензорной обработки, Cloud TPU v5p, сопровождаемой прорывной суперкомпьютерной архитектурой под названием AI Hypercomputer. Эти инновационные релизы, вместе с инструментом управления ресурсами Dynamic Workload Scheduler, являются важным шагом вперед в обработке задач ИИ для организаций.

Cloud TPU v5p, преемник введенного в ноябре v5e, выделяется как самый мощный TPU от Google. В отличие от своего предшественника, v5p имеет производительностную конструкцию, обещающую примечательные улучшения в возможностях обработки. С 8 960 чипами на под и скоростью соединения 4 800 Гбит/с между чипами, эта версия предлагает удвоение FLOPS и внушительное увеличение в 3 раза по объему высокопропускной памяти (HBM) по сравнению с предыдущим TPU v4.

Сосредоточенность на производительности значительно завоевывает успех, с Cloud TPU v5p, демонстрирующим поразительное улучшение скорости в 2.8 раза по сравнению с TPU v4 при обучении больших моделей LLM. Кроме того, с использованием разреженных ядер второго поколения, v5p показывает скорость обучения, которая быстрее в 1.9 раза для встроенных моделей с плотной памятью по сравнению с предшественником.

Параллельно с этим, AI Hypercomputer становится кардинальной изменой в суперкомпьютерных архитектурах. Она объединяет оптимизированное аппаратное обеспечение, программное обеспечение с открытым исходным кодом, основные фреймворки машинного обучения и гибкие модели потребления. Отказываясь от традиционного метода укрепления отдельных компонентов, AI Hypercomputer использует совместную конструкцию системы для увеличения эффективности и продуктивности ИИ в области обучения, настройки и предоставления услуг.

Эта передовая архитектура основывается на тщательно оптимизированном вычислительном, хранилище и сетевом проектировании на основе инфраструктуры ультракрупного центра обработки данных. Более того, она предоставляет разработчикам доступ к связанному аппаратному обеспечению через программное обеспечение с открытым исходным кодом, поддерживая фреймворки машинного обучения, такие как JAX, TensorFlow и PyTorch. Интеграция распространяется на программное обеспечение, такое как Multislice Training и Multihost Inferencing, с глубокой интеграцией с Google Kubernetes Engine (GKE) и Google Compute Engine.

То, что действительно выделяет AI Hypercomputer, это ее гибкая модель потребления, предназначенная специально для задач ИИ. Она вводит инновационный инструмент управления ресурсами Dynamic Workload Scheduler и традиционные модели потребления, такие как скидки за использование с обязательством (CUD), по требованию и Spot. Эта платформа управления ресурсами и планирования задач поддерживает Cloud TPU и графическое ускорение Nvidia, обеспечивая планирование всех необходимых ускорителей для оптимизации затрат пользователей.

В рамках этой модели, опция Flex Start идеально подходит для настройки моделей, экспериментов, коротких сессий обучения, обоснования в офлайн-режиме и пакетных задач. Она предлагает экономически эффективный способ запроса мощности GPU и TPU в предварительной подготовке к выполнению. С другой стороны, режим Календарь позволяет забронировать конкретные время начала, учитывая тренировочные и экспериментальные задачи, требующие точных времени начала и длительности в течение 7 или 14 дней, доступных для приобретения за 8 недель вперед.

В заключение, анонсирование Google Cloud TPU v5p, AI Hypercomputer и Dynamic Workload Scheduler представляет собой громадный шаг в возможностях обработки ИИ, открывая новую эру повышенной производительности, оптимизированных архитектур и гибких моделей потребления для задач ИИ. Эти инновации обещают изменить ландшафт вычислений ИИ и прокладывают путь для прорывных достижений в различных отраслях.

Статья Google Unveils Cloud TPU v5p and AI Hypercomputer: A Leap in AI Processing Power появилась сначала на MarkTechPost.