Это исследование ИИ представляет MeshGPT новый подход к генерации формы, который непосредственно выводит сетки в виде треугольников.

Новая генерация формы исследование ИИ MeshGPT, выводящее сетки в треугольниковом виде

“`html

MeshGPT предлагает исследователям из Технического университета Мюнхена, Политехнического университета Турина и компании AUDI AG метод авторегрессивной генерации треугольных сеток, используя архитектуру, основанную на GPT и обученную на изученном словаре последовательностей треугольников. Данный подход использует геометрический словарь и латентные геометрические токены для представления треугольников и позволяет создавать благородные, чистые, компактные сетки с острыми ребрами. В отличие от других методов, MeshGPT напрямую генерирует триангулированные сетки, не требуя их конвертации, и демонстрирует способность создавать и знакомые, и новые реалистично выглядящие формы с высокой точностью.

Ранние методы генерации формы, включая методы на основе вокселей и облаков точек, ограничены в возможности передачи мелких деталей и сложной геометрии. Несмотря на то, что методы неявного представления кодируют форму в виде объемных функций, они часто требуют конвертации в сетки и порождают густые сетки. Предыдущие методы генерации треугольных сеток на основе обучения требовали дополнительной помощи в точном захвате деталей формы. MeshGPT, в отличие от PolyGen, использует только декодерную сеть, использование изученных токенов для представления треугольников позволяет получить удобное, эффективное и качественное создание трехмерных сеток с улучшенной устойчивостью во время вывода.

MeshGPT предлагает подход к генерации трехмерных форм, напрямую создающий треугольные сетки с использованием модели преобразователей только-декодер. Метод достигает благородных и компактных сеток с использованием изученного геометрического словаря и графового сверточного энкодера для представления треугольников в виде латентных обозначений. Декодер ResNet обеспечивает получение последовательности треугольников методом авторегрессии. MeshGPT превосходит существующие методы по покрытию формы и показателям Fréchet Inception Distance (FID), обеспечивая упрощенный процесс создания трехмерных объектов без последующей обработки плотными или чрезмерно сглаженными результатами.

MeshGPT использует модель преобразователя только-декодера, обученную на геометрическом словаре, который декодирует токены в треугольные сетки. Он использует графовый сверточный энкодер для преобразования треугольников в латентные квантованные вложения, которые затем переводятся в координаты вершин с помощью ResNet. Предобучение на всех категориях, дообучение с помощью аугментаций во время обучения и проведение абляций с оценкой компонент, таких как геометрические вложения, были осуществлены. Производительность MeshGPT оценивается по покрытию формы и показателям FID, демонстрируя превосходство по сравнению с передовыми методами.

MeshGPT демонстрирует превосходную производительность по сравнению с выдающимися методами генерации треугольных сеток, включая Polygen, BSPNet, AtlasNet и GET3D, демонстрируя превосходство в качестве формы, качестве триангуляции и разнообразии форм. Этот процесс создает чистые, благородные и детализированные сетки с острыми ребрами. В рамках пользовательского исследования MeshGPT оказался намного предпочтительнее по сравнению с конкурирующими методами по качеству формы в целом и сходству паттернов триангуляции. MeshGPT способен генерировать новые формы, отличные от обучающих данных, подчеркивая его реализм. Абляционные исследования подчеркивают положительное влияние изученных геометрических вложений на качество формы по сравнению с наивной токенизацией координат.

В заключение, MeshGPT успешно генерирует трехмерные треугольные сетки высокого качества с острыми ребрами. Использование только декодерных преобразователей и включение изученных геометрических вложений в обучение словаря позволило получить формы, близкие к реальным паттернам триангуляции и превосходящие существующие методы по качеству формы. Недавнее исследование показало, что пользователи предпочитают MeshGPT за его высокое качество формы и сходство с реальными паттернами триангуляции по сравнению с другими методами.

“`