Эта научная работа представляет фреймворк SANeRF-HQ (Segment Anything for NeRF in High Quality), который позволяет достигать высококачественной 3D-сегментации любого объекта в заданной сцене.

Фреймворк SANeRF-HQ Высококачественная 3D-сегментация любого объекта в заданной сцене

Исследователи из Гонконгского университета науки и технологий, Карнеги-Меллонского университета и Дартмутского колледжа разработали метод SANeRF-HQ (Segment Anything for NeRF in High Quality), позволяющий достичь точной трехмерной сегментации в сложных сценариях. До этого методы сегментации объектов, основанные на NeRF, имели ограниченную точность. Однако SANeRF-HQ объединяет модель Segment Anything (SAM) и нейронные радиантные поля (NeRF) для повышения точности сегментации и создания трехмерной сегментации высокого качества в сложных средах.

NeRF, популярный при решении задач трехмерной обработки, сталкивается с проблемами в сложных сценариях. SANeRF-HQ преодолевает эти проблемы, используя SAM для сегментации объектов в открытом мире с помощью инструкций пользователя и NeRF для агрегации информации. Он превосходит предыдущие методы NeRF, обеспечивая улучшенную гибкость локализации объектов и последовательную сегментацию в разных ракурсах. Количественная оценка наборов данных NeRF подчеркивает его потенциал для компьютерного зрения и сегментации в трех измерениях.

NeRF проявляет отличные результаты при синтезе новых ракурсов с использованием многослойных персептронов. Хотя сегментация трехмерных объектов в рамках NeRF преуспела, предыдущие методы, такие как Semantic-NeRF и DFF, основаны на ограниченных моделях с предварительным обучением. Модель SAM позволяет использовать разнообразные подсказки и успешно обобщает для сегментации с нулевым обучением на новых объектах. SANeRF-HQ использует модель SAM для сегментации объектов в открытом мире и NeRF для агрегации информации, которая позволяет справиться с вызовами в сложных сценариях, превосходя предыдущие методы сегментации NeRF по качеству результатов.

SANeRF-HQ использует контейнер особенностей, декодер маски и агрегатор маски для достижения трехмерной сегментации высокого качества. Он кодирует особенности модели SAM, генерирует промежуточные маски и интегрирует двумерные маски в трехмерное пространство с использованием полей окраски и плотности NeRF. Система объединяет модель SAM и NeRF для сегментации объектов в открытом мире и агрегации информации. Она может выполнять текстовую и автоматическую сегментацию в трех измерениях с использованием видеороликов, созданных с помощью NeRF, и автоматическую функцию сегментации модели SAM.

SANeRF-HQ превосходит предыдущие методы NeRF в области высококачественной сегментации трехмерных объектов. Он предлагает улучшенную гибкость локализации объектов и последовательную сегментацию в разных ракурсах. Количественная оценка на нескольких наборах данных NeRF подтверждает его эффективность. SANeRF-HQ имеет большой потенциал в динамической сегментации NeRF, обеспечивая сегментацию на основе текстовых подсказок и создавая возможность автоматической сегментации в трех измерениях. Использование полей плотности, сходства цветового пространства RGB и потерь RGB для пары лучей повышает точность сегментации, заполняя пропущенные внутренние и граничные области, результатом чего становится улучшение визуального качества и более надежные результаты сегментации.

В заключение, SANeRF-HQ является высокоэффективной трехмерной сегментационной техникой, превосходящей предыдущие методы NeRF по гибкости и последовательной сегментации в разных ракурсах. Его превосходные результаты на различных наборах данных NeRF указывают на его потенциал для существенного вклада в компьютерное зрение и техники сегментации в трех измерениях. Расширение его возможностей до сегментации динамических объектов NeRF в четырех измерениях и использование полей плотности, сходства цветового пространства RGB и потерь RGB для пары лучей дальше повышают его точность и качество путем включения цвета и пространственной информации.

Будущие исследования могут исследовать потенциал SANeRF-HQ в сегментации динамических объектов NeRF в четырех измерениях. Оно может расширить свои возможности, исследуя применение в сложных сценариях и открытом мире, в сочетании с внедрением передовых техник, таких как семантическая сегментация и разделение сцены. Проведение пользовательских исследований, оценивающих возможность использования SANeRF-HQ и его эффективность в реальных сценариях, может предоставить ценную обратную связь. Дальнейшее исследование его масштабируемости и эффективности для крупномасштабных сцен и наборов данных является необходимым для оптимизации производительности в практических приложениях.