Learn more about Computer Vision
Исследование ИИ из Китая представляет GS-SLAM новый подход для улучшенного трехмерного картографирования и локализации
Исследователи из Шанхайской лаборатории искусственного интеллекта, университета Фудан, Северо-Западного политехническ...
Генерация информационно насыщенного текста для сильного перекрестного модального интерфейса в LLM с дефузией
Глобальное явление продуктов LLM (Large Language Model), наиболее ярким примером которых является широкое принятие Ch...
Эта исследовательская статья по искусственному интеллекту предлагает новую стратегию предварительного обучения, называемую Privacy-Preserving MAE-Align, для эффективного объединения синтетических данных и реальных данных, обработанных без участия человека
Распознавание действий, задача идентификации и классификации действий человека на видео последовательностях, является...
Google и исследователи из MIT представляют StableRep революционное обучение искусственного интеллекта с помощью синтетической графики для улучшения машинного обучения
Исследователи исследовали возможность использования синтетических изображений, сгенерированных моделями текст-изображ...
Познакомьтесь с One-2-3-45++ Инновационным методом искусственного интеллекта, который преобразует одно изображение в подробную 3D-текстурированную сетку за примерно одну минуту.
Исследователи из Университета Калифорнии в Сан-Диего, Зейцзянского университета, Университета Цинхуа, UCLA и Стэнфорд...
Встречайте LEO Революционный мульти-модальный агент воплощенного виртуального присутствия для интеракции с 3D-миром и решения задач
Искусственный интеллект, способный выполнять несколько задач или областей без значительной перенастройки или повторно...
Эта статья об искусственном интеллекте из Китая представляет ‘Monkey’ новый подход к искусственному интеллекту для улучшения разрешения ввода и контекстуальной связи в больших мультимодальных моделях
“`html Большие мультимодальные модели становятся все более популярными благодаря своей способности обрабатывать...
ByteDance представляет PixelDance новый подход к генерации видео на основе моделей распространения, который включает инструкции по изображениям вместе с текстовыми инструкциями.
Команда исследователей из ByteDance Research представляет PixelDance – подход к созданию видео, использующий те...
Исследователи из Китая представляют Video-LLaVA простую, но мощную базовую модель для больших визуально-языковых данных.
“`html Исследователи из Пекинского университета, Лаборатории Пенг Чэнг, Пекинской градской школы и Сунь Ятсена ...
Исследователи из Университета Чикаго представляют 3D кисть метод искусственного интеллекта для генерации локально стилизованных текстур на сетках с использованием текста в качестве входных данных.
3D кисти для рисования обычно используются при создании и моделировании 3D-объектов или моделей. Эти инструменты позв...

- You may be interested
- Робот имитирует вымершего морского орга...
- Python Вычисление интегралов правильным...
- Google AI представляет Spectron первую ...
- Обзор алгоритмов сортировки Быстрая сор...
- Точная настройка стабильных моделей диф...
- Tailor представляет плагин ChatGPT, поз...
- Обзор больших языковых моделей (LLM)
- Семантический уровень основа AI-приводи...
- 50+ Новейших инструментов искусственног...
- Эта научная статья исследует слияние ко...
- Рекомендательные системы на основе неяв...
- Автоматизируйте предварительное разреше...
- Топ проектов по генеративному искусстве...
- 10 лучших конструкторов приложений AI б...
- «Создание собственного чат-бота на базе...