Apple M2 Max GPU против Nvidia V100, P100 и T4

Apple M2 Max GPU против Nvidia V100, P100 и T4 сравнение великих

Сравнение производительности графического процессора Apple Silicon M2 Max с Nvidia V100, P100 и T4 для обучения моделей MLP, CNN и LSTM с использованием TensorFlow.

Изображение автора

Запущенный в ноябре 2020 года, Apple M1 стал революцией в мире компьютеров, где доминировала Intel. Новые Mac-компьютеры с чипом M1 продемонстрировали впечатляющую производительность во многих бенчмарках, превзойдя по скорости большинство высокопроизводительных настольных компьютеров, но потребляя лишь небольшую долю их энергии.

Вот мои предыдущие результаты бенчмарков для M1:

Бенчмарк M1 против Xeon® против Core i5 против K80 и T4

M1 конкурирует с 20-ядерным Xeon® в обучении TensorFlow

В январе 2023 года Apple анонсировала новые модели M2 Pro и M2 Max. Их технические характеристики позволяют ожидать увеличение производительности, особенно в отношении графического процессора.

Сравнение M2 Max с характеристиками M1

У M2 Max есть 30 графических ядер, поэтому мы оценили 10,7 TFLOPS на основе 13,6 TFLOPS в версии с 38 графическими ядрами.

Сравнение графических процессоров

В сравнении с ним, графический процессор M2 Max с 38 ядрами достигает 13,6 TFLOPS. В моем тесте ниже будет показано, что только TFLOPS недостаточно для оценки фактической производительности этих графических процессоров.

Чтобы получить сравнимые результаты, я выполнил каждый тест с использованием стандартной точности с плавающей запятой FP32 в TensorFlow.

Вы можете проверить эту точность, выполнив следующий код:

tf.keras.backend.floatx()'float32'

Установка

В этой статье я провожу бенчмарк графического процессора M2 Max в сравнении с Nvidia V100, P100 и T4 для моделей MLP, CNN и LSTM в TensorFlow.

Настройка бенчмарка

На компьютерах M1 и M2 Max окружение было создано с использованием miniforge. Были установлены только следующие пакеты:

conda install python=3.10conda install tensorflowconda…