Это исследование в области ИИ от MIT и Meta AI представляет инновационный и доступный контроллер для расширенной мгновенной реориентации объектов в робототехнике.

Исследование MIT и Meta AI инновационный и доступный контроллер для мгновенной переориентации объектов в робототехнике

Исследователи из MIT и Meta AI разработали контроллер поворота объектов, который может использовать одну глубинную камеру для переориентации разнообразных форм объектов в режиме реального времени. Основная проблема, решаемая в данной разработке, заключается в необходимости универсальной и эффективной системы манипуляции объектами, которая способна обобщаться на новые условия без необходимости обеспечения одинаковой позы ключевых точек для разных объектов. Платформа также может расширяться на другие демонстрации ловкости искусного управления, и будущие исследования показывают потенциал для дальнейшего развития.

Текущие методы, используемые в исследованиях поворота объектов, имеют свои ограничения, такие как фокусировка на конкретных объектах, ограниченный диапазон и медленное управление, основанное на дорогостоящих датчиках, а также возможность предоставления только симуляционных результатов. Эти методы должны эффективно решать проблемы передачи симуляции в реальные сценарии. Уровень успеха часто зависит от пороговых значений ошибки, которые варьируются в зависимости от задачи. Студентская политика видения была обучена для решения этих ограничений и продемонстрировала минимальное различие между наборами данных.

Это исследование представляет методы улучшения манипулятивных возможностей роботической руки, справляющихся с проблемой поворота объектов внутри руки. Предыдущие подходы вносили ограничения и требовали дорогостоящих сенсоров, ограничивая их универсальность. Для преодоления этих ограничений был обучен контроллер, используя подкрепляющее обучение в симуляции, который успешно проявляет обобщение на новые формы в реальном мире. Также были рассмотрены проблемы обучения контроллеров с визуальным вводом и достижения эффективности передачи симуляции в реальные условия.

Предлагаемый метод включает использование подкрепляющего обучения для тренировки контроллера поворота объектов на основе зрения в симуляции, а затем непосредственное использование его в реальном мире без дополнительного обучения. Обучение использует сверточную нейронную сеть с расширенной емкостью и запоминающую ячейку с использованием физического симулятора Isaac Gym на столешнице. Функция вознаграждения включает критерий успеха и дополнительные значения формирования. Для оценки эффективности метода были проведены тесты на объектах, изготовленных на 3D-принтере, и на объектах реального мира, сравнение результатов симуляции и реального мира основано на распределении ошибок и уровнях успеха в определенных порогах.

Единый контроллер, обученный в симуляции для поворота 150 объектов, был успешно развернут в реальном мире на трехпалой и модифицированной четырехпалой манипуляторах D’Claw. Была достигнута работа в режиме реального времени со скоростью 12 Гц с использованием стандартной рабочей станции. Оценка, которая использовала систему захвата движения OptiTrack, показала точное переориентирование объектов и способность обобщаться на новые формы объектов. Анализ распределения ошибок и уровня успешности в заданных порогах показал эффективность системы в решении задач передачи симуляции в реальные условия и возможные улучшения точности без дополнительных предположений.

В заключение, в этом исследовании успешно разработан контроллер в режиме реального времени с использованием подкрепляющего обучения, который эффективно переориентирует объекты в реальном мире. Хотя среднее время переориентации системы составляет около семи секунд, оно вызывает вопросы о важности информации о форме в задачах поворота. Оно также подчеркивает проблемы передачи результатов симуляции в реальный мир. Несмотря на эти сложности, контроллер имеет потенциал для применения в манипуляции внутри руки, особенно в менее структурированных средах, и критикует необходимость улучшения точности без дополнительных предположений.

Одной из потенциальных областей для дальнейших исследований является изучение того, как интеграция информации о форме может улучшить работу контроллера, особенно в частности для точной манипуляции и обобщения на новые формы. Стоит исследовать возможность использования визуального ввода для обучения, что может решить ограничения текущих контроллеров на основе подкрепляющего обучения, которые полагаются на информацию о полном состоянии симуляции. Наконец, сравнительные исследования с предыдущими работами могли бы помочь привести полученные результаты в контекст существующей литературы, а также исследование искусного управления с использованием аппаратного обеспечения с открытым исходным кодом требует дальнейшего исследования.