Исследователи из Университета в Йокогаме предлагают VirSen1.0 виртуальную среду для оптимизации разработки систем распознавания жестов человека, основанных на сенсорах.
Исследователи предлагают VirSen1.0 - виртуальную среду для оптимизации разработки систем распознавания жестов человека на основе сенсоров.
Технология распознавания жестов сталкивается с существенными проблемами в конфигурации и размещении сенсоров, интерпретации данных и точности машинного обучения. Эффективная настройка сенсоров для захвата тонких движений, надежная интерпретация полученных данных и обеспечение точного распознавания задуманных жестов с помощью алгоритмов машинного обучения остаются постоянными проблемами. Эти проблемы не только затрудняют оптимальную работу, но и ограничивают более широкое использование жестовых систем в различных приложениях.
Команда исследователей из Йокогамского университета в Японии представила новую модель компьютерного распознавания жестов человека. Работа рассматривает разработку пользовательского интерфейса (UI) под названием VirSen 1.0, который позволяет пользователям интерактивно размещать виртуальные оптические сенсоры в виртуальном пространстве для создания системы оценки жестов. Он позволяет пользователям экспериментировать с размещением сенсоров и оценивать их влияние на распознавание жестов без физических сенсоров.
Данные собираются для обучения путем выполнения желаемого жеста аватаром. Исследователи обсуждают связанную работу в симуляторах для управления сенсорами, подчеркивая уникальность своего подхода, объединяющего ситуации, сбор данных и создание модели в одном программном инструменте. Для использования используется классификатор на основе метода опорных векторов (SVM) с ядром радиальной базисной функции из-за невозможности сбора большого объема данных для обучения. Исследование подчеркивает важность показателя вклада важности перестановки (PFI) в определении размещения сенсоров, которое приводит к высоким показателям распознавания. PFI определяет, как отдельные функции влияют на прогноз модели путем их упорядочивания. PFI предоставляет информацию о функциях, помогая оптимизировать размещение сенсоров в процессе проб и ошибок.
- Эта исследовательская статья по искусственному интеллекту представляет всеобъемлющий обзор глубокого обучения для визуальной локализации и картографирования.
- Исследователи Microsoft предлагают открытый словарь ответственного визуального синтеза (ORES) с двухэтапной схемой вмешательства.
- Революционное восстановление речи исследование под руководством Стэнфордского университета представляет высокопроизводительный нейропротез для неограниченного общения
Оптический сенсор в данном исследовании состоит из инфракрасного светодиода и фотодетекторного транзистора. Сбор данных начинается, когда значения сенсоров превышают определенный порог по сравнению с предыдущим кадром. Человеческие жесты записываются с помощью инструмента захвата движения Xsens, который захватывает инерционные сенсоры. Он захватывает шесть трехмерных жестов, включая приседания, прыжки, наклоны и поднятые руки. Реализация включает визуальное представление интерфейса симулятора, позволяющее пользователям размещать объекты, собирать данные, визуализировать значения сенсоров и оценивать точность с помощью показателя вклада PFI.
Исследовательская группа планирует улучшить симулятор, включая дополнительные функции для проверки предыдущих размещений и результатов, предлагая размещение сенсоров на основе показателя вклада PFI. В будущем авторы планируют решить определенные ограничения, включая неучет влияния одежды на точность распознавания, отсутствие моделирования шума и ошибок сенсоров, скорость обработки и ограничение на распознаваемые цели.