Представляем три новых экземпляра Amazon EC2, основанных на графических процессорах NVIDIA

Познакомьтесь с тремя новыми экземплярами Amazon EC2 на основе графических процессоров NVIDIA

Amazon Elastic Compute Cloud (Amazon EC2) предлагает самый широкий выбор ускорителей для вашей искусственнного интеллекта (AI), машинного обучения (ML), графики и высокопроизводительных вычислений (HPC). Мы с восторгом объявляем о расширении этого портфолио с тремя новыми экземплярами, оснащенными последними графическими процессорами NVIDIA: экземпляры Amazon EC2 P5e, работающие на графическом процессоре NVIDIA H200, экземпляры Amazon EC2 G6 с графическими процессорами NVIDIA L4 и экземпляры Amazon EC2 G6e, работающие на графическом процессоре NVIDIA L40S. Все три экземпляра будут доступны в 2024 году, и мы с нетерпением ждем, что вы сможете сделать с их помощью.

AWS и NVIDIA сотрудничают более 13 лет и являются пионерами сверхпроизводительных и экономически эффективных решений на базе графических процессоров для разработчиков и предприятий на всех уровнях. Мы объединили мощные графические процессоры NVIDIA с уникальными технологиями AWS, такими как AWS Nitro System, сеть Elastic Fabric Adapter (EFA) версии 2 с пропускной способностью 3,200 Гбит/с, сотни гигабайт в секунду пропускной способности данных с Amazon FSx for Lustre и решение Amazon EC2 UltraClusters для выполнения экза-масштабных вычислений, обеспечивающих самую высокую производительность для задач по искусственному интеллекту (AI), машинному обучению (ML), графике и высокопроизводительным вычислениям (HPC). В сочетании с другими управляемыми сервисами, такими как Amazon Bedrock, Amazon SageMaker и Amazon Elastic Kubernetes Service (Amazon EKS), эти экземпляры предоставляют разработчикам лучшую платформу для создания и развертывания искусственного интеллекта (AI), высокопроизводительных вычислений (HPC) и графики.

Высокопроизводительные и экономически эффективные экземпляры на базе графических процессоров для искусственного интеллекта (AI), высокопроизводительных вычислений (HPC) и графики

Чтобы обеспечить разработку, обучение и вывод наибольших языковых моделей (LLMs), экземпляры EC2 P5e будут оснащены последними графическими процессорами NVIDIA H200, которые предлагают 141 Гбайт памяти HBM3e GPU, что в 1.7 раза больше и 1.4 раза быстрее, чем графический процессор H100. Это увеличение памяти графического процессора в сочетании с сетью EFA с пропускной способностью до 3200 Гбит/с, обеспечиваемой благодаря AWS Nitro System, позволит вам продолжать создавать, обучать и развертывать передовые модели на AWS.

Экземпляры EC2 G6e, работающие на графическом процессоре NVIDIA L40S, предназначены для обеспечения разработчиков широкодоступным вариантом для обучения и вывода публично доступных языковых моделей (LLMs), а также для поддержки все более популярных небольших языковых моделей (SLM). Они также оптимальны для использования в приложениях “цифровых двойников”, которые используют NVIDIA Omniverse для описания и моделирования в различных 3D-инструментах и приложениях, а также для создания виртуальных миров и передовых рабочих процессов для цифровизации промышленности.

Экземпляры EC2 G6, работающие на графическом процессоре NVIDIA L4, предоставят решение с более низкой стоимостью и энергоэффективное решение для развертывания моделей машинного обучения для обработки естественного языка, преобразования языка, анализа видео и изображений, распознавания речи, индивидуализации, а также для работы с графикой, такой как создание и визуализация графики высокого качества в реальном времени и трансляция игрового процесса.