Слияние изображений с помощью искусственного интеллекта и DGX GH200

Слияние изображений с помощью искусственного интеллекта и DGX GH200' (Merging images with artificial intelligence and DGX GH200)

От пикселей до панорам: внутри AI, измерение и сшивка, и AI-мощность дата-центра

DGX GH200 AI Supercomputer (1 GPU, тяжелее 4-х слонов)

В области компьютерного зрения (CV) способность сшивать частичные изображения и измерять размеры не просто продвинутый трюк — это важный навык. Будь то создание панорамного изображения с помощью смартфона, измерение расстояния между объектами на видеозаписи наблюдения или анализ научных изображений, и сшивка изображений и измерение играют важную роль. Эта статья призвана развеять мифы о двух увлекательных аспектах CV. Затем я расскажу о облачной AI-инфраструктуре, мощи AI-дата-центра.

Искусство сшивки

Сшивка изображений — это не только алгоритмическое испытание, но и искусство. Алгоритмы сшивки стремятся бесшовно объединить несколько изображений в одно обширное изображение, свободное от швов, искажений и цветовой несогласованности. Открытые методы варьируются по сложности от традиционных алгоритмов поиска особенностей, таких как SIFT и SURF, до моделей глубокого обучения, таких как DeepStitch.

Традиционное vs. глубокое обучение

  • Традиционные методы: Алгоритмы, такие как SIFT (Масштабно-инвариантное преобразование особенностей) и SURF (Ускоренные и устойчивые функции), используют ключевые точки и дескрипторы для поиска перекрывающихся областей между изображениями. Эти методы работают быстро и хорошо подходят для простых случаев, но могут испытывать сложности в более сложных сценах.
  • Модели глубокого обучения: Решения, такие как DeepStitch, используют нейронные сети для нахождения оптимальных точек сшивки, обеспечивая более высокую точность, особенно в сложных сценах.

Ниже приведены доступные открытые алгоритмы или библиотеки для сшивки изображений и создания панорам.

Открытые алгоритмы и AI-модели для сшивки изображений (собрано автором и воссоздано GPT-4)

Измерение в двухмерном мире

Сшивка изображений позволяет расширить наше зрительное поле, но что насчет понимания мира внутри этой области видимости? Вот где на помощь приходит измерение изображений. От использования простых евклидовых расчетов расстояний в калиброванной среде до использования моделей глубокого обучения, способных идентифицировать и измерять объекты, техники разнообразны.

От простого к сложному

  • Методы калибровки: Техники, такие как калибровка камеры, предоставляют возможность связать размеры пикселей с размерами реального мира. После проведения калибровки даже простые геометрические формулы могут давать точные измерения.
  • Обнаружение и отслеживание объектов: Модели глубокого обучения, такие как YOLO или SSD, умеют идентифицировать объекты как на статических изображениях, так и в режиме реального времени, что открывает путь к автоматизированному измерению.

Ниже приведены доступные открытые методы для измерения и фотограмметрии.

Открытые методы фотограмметрии (собрано автором и воссоздано GPT-4)

Сшивка и измерение: две стороны одной медали

Возможно, вас интересует, почему мы обсуждаем сшивку и измерение вместе. Причина в том, что они часто идут рука об руку. Например, в приложениях наблюдения сшитый панорамный вид местности может использоваться для отслеживания и измерения точного расстояния между несколькими целями. В медицинском изображении сшитые изображения с разных углов могут предоставить более полное представление, облегчая более точные измерения.

Краткое описание для CV Pixels

Будь вы любителем, исследователем или просто интересующимся применением CV, как шитье, так и измерение являются важными техниками для понимания. В то время как традиционные алгоритмы предлагают быстрый и простой подход, появление глубокого обучения открыло дверь к невиданным уровням точности и сложности. Это захватывающее время для погружения в мир CV, где граница между пикселем и панорамой продолжает смываться, предлагая нам более четкий взгляд на общую картину.

Область развивается со стремительными темпами, и важно быть в курсе последних алгоритмов и методологий. Так что продолжайте шить свой путь через панорамы и измерять мир, пиксель за пикселем!

AI Giant Foundation: DGX GH200

Используя AI/CV для продвинутого шитья и измерения, мы также признаем фундаментальную роль графических процессоров (GPU) в поддержке наших решений, основанных на искусственном интеллекте. В эту период трансформации AI, AI Supercomputer DGX GH200 компании Nvidia является монументальным прорывом. Этот вычислительный гигант с одним GPU, весом как четыре слона, переопределяет возможности.

Далеко не просто большая машина, его непревзойденные возможности предлагают потрясающую 144 ТБ общей памяти на 256 графических процессорах NVIDIA Grace Hopper Superchips (GH200). Это дает разработчикам почти в 500 раз больше памяти, позволяя создавать сложные, масштабные модели для решения самых сложных проблем. На самом деле, это не просто машина, но будущее AI воплотилось.

К GH200

Графический процессор GH200 Grace Hopper объединяет архитектуры Grace и Hopper компании NVIDIA с помощью NVLink-C2C, предлагая единую модель памяти CPU+GPU (H100), оптимизированную для приложений в области искусственного интеллекта и высокопроизводительных вычислений. В качестве GPU дата-центра девятого поколения, Tensor Core H100 вводит новый Transformer Engine, обеспечивающий до 9-кратного ускорения обучения и до 30-кратного ускорения вывода AI по сравнению с предшественником A100.

В майской стратегической переименовательной акции в 2020 году, компания Nvidia переименовала свою линейку графических процессоров Tesla в Nvidia Data Center GPUs, чтобы избежать путаницы с брендом автомобилей Tesla. Изначально конкурируя с Radeon Instinct от AMD и Xeon Phi от Intel, эти графические процессоры поддерживали программирование CUDA или OpenCL и были ключевыми в глубоком обучении и вычислительных задачах.

Охватывая десять поколений, каждое с отличающимися микроархитектурами – Tesla, Fermi, Kepler, Maxwell, Pascal (P100), Volta (V100), Turing (T4), Ampere (A100, A40), Hopper (H100) и Ada Lovelace (L40) – графические процессоры дата-центра Nvidia последовательно продвигали границы в глубоком обучении и научных вычислениях.

DGX GH200 против GH200 против H100

В чем разница между DGX GH200, GH200 и H100?

gpus.llm-utils.org

NVIDIA объявляет о DGX GH200 AI Supercomputer

NVIDIA сегодня объявила о новом классе суперкомпьютеров с большой памятью для искусственного интеллекта – суперкомпьютер NVIDIA DGX™, работающий на платформе NVIDIA®…

nvidianews.nvidia.com

NVIDIA Grace Hopper Superchip

Прорывное ускоренное ЦПУ, разработанное с нуля для гигантских масштабов применения искусственного интеллекта и высокопроизводительных вычислений.

www.nvidia.com

Техническое описание процессора NVIDIA Grace Hopper Superchip

Архитектура NVIDIA Grace™ Hopper™ объединяет прорывную производительность графического процессора NVIDIA Hopper с…

resources.nvidia.com

Nvidia Tesla – Википедия

Переключите содержание из Википедии, свободной энциклопедии Производитель Nvidia Введено 2 мая 2007 года; 16 лет…

en.wikipedia.org

Решения NVIDIA для суперкомпьютеров

Узнайте, как использовать графические процессоры NVIDIA Data Center – для обучения, вывода, высокопроизводительных вычислений и искусственного интеллекта…

www.nvidia.com