NVIDIA представляет H200 Tensor Core GPU для работы с искусственным интеллектом и высокопроизводительными вычислениями (HPC).

NVIDIA представляет H200 Tensor Core GPU для работы с искусственным интеллектом и высокопроизводительными вычислениями (HPC)

На прошлой неделе NVIDIA представила H200 Tensor Core GPU. Эта GPU надеется установить новый показательный стандарт как самый мощный в мире GPU, разработанный для дополнительного ускорения искусственного интеллекта и высокопроизводительных вычислений HPC.

H200 основан на архитектуре NVIDIA Hopper, GPU оснащен HBM3e и обеспечивает беспрецедентные 141 гигабайт памяти со скоростью впечатляющих 4,8 терабайта в секунду. Это почти вдвое больше емкости предыдущей версии GPU NVIDIA H100 Tensor Core GPU, и имеет 1,4 раза больший пропускной способности памяти.

Как видим, это значительное увеличение объема и скорости памяти ускоряет создание генеративных ИИ и крупных языковых моделей, а также повышает научные вычисления для HPC-нагрузки. Например, при выводе Llama2 70B достигается ускорение в 1,9 раза, а при выводе GPT-3 175B – в 1,6 раза.

Пропускная способность памяти играет решающую роль в приложениях HPC, обеспечивая более быструю передачу данных и устранение узких мест обработки. Для память-интенсивных задач, таких как симуляции, научные исследования и ИИ, более высокая пропускная способность памяти H200 обеспечивает впечатляющие 110 раз более быстрое время получения результатов по сравнению с традиционными ЦП.

H200 также повышает скорость вывода до 2 раз по сравнению с предыдущей версией GPU H100, особенно при работе с сложными LLM, такими как Llama2. При этом H200 сохраняет энергоэффективность, работая в том же энергопрофиле, что и H100.

Это помогает компаниям поддерживать и согласовывать с экологически дружественными практиками. Потребление энергии становится все более актуальной проблемой, поскольку все больше компаний переходят на генеративный ИИ, и NVIDIA явно принимает это во внимание при разработке H200.

NVIDIA надеется, что с выпуском H200 она устанавливает новый стандарт возможностей для GPU. Это становится все важнее, поскольку AI и научные сообщества продолжают полагаться на вывод AI для содействия передовым исследованиям.

В последние годы все больше исследовательских команд зависят от мощности моделей для поиска новых комбинаций белков и выявления болезни Паркинсона. Как это повлияет на общий рынок GPU, пока неизвестно.