Познакомьтесь с LocoMuJoCo новым бенчмарком машинного обучения, разработанным для обеспечения тщательной оценки и сравнения алгоритмов имитационного обучения.

Узнайте больше о LocoMuJoCo - новом бенчмарке машинного обучения, который обеспечивает детальную оценку и сравнение алгоритмов имитационного обучения.

Исследователи группы Intelligent Autonomous Systems, Локомоционной лаборатории, Германского центра искусственного интеллекта, Центра когнитивных наук и Hessian.AI представили новый бенчмарк для продвижения исследований в области имитационного обучения (IL) для передвижения, в котором учитываются ограничения существующих показателей, которые часто сосредоточены на упрощенных задачах. Этот новый бенчмарк включает различные среды, включая четвероногих, двуногих и мышценапряженные модели человека, сопровождаемые всесторонними наборами данных. Он включает в себя реальные шумовые данные захвата движения, данные специалистов-экспертов и данные о недостаточно оптимальном решении для оценки в условиях различной сложности.

Учитывая ограничения существующих бенчмарков, LocoMuJoCo предлагает разнообразные среды, такие как четвероногие, двуногие и мышценапряженные модели человека. Вместе с реальными шумовыми данными захвата движения, данными специалистов-экспертов и недостаточно оптимальными данными, бенчмарк обеспечивает полную оценку алгоритмов IL при разных уровнях сложности. В исследовании подчеркивается необходимость использования метрик, основанных на вероятностных распределениях и биомеханических принципах, для эффективной оценки качества поведения.

LocoMuJoCo – это бенчмарк на основе Python, созданный специально для имитационного обучения в задачах передвижения, который стремится решить проблемы стандартизации существующих стандартов. LocoMuJoCo совместим с библиотеками Gymnasium и Mushroom-RL, предлагая разнообразные задачи и наборы данных для передвижения гуманоидов и четвероногих существ, а также мышценапряженные модели человека. Бенчмарк охватывает различные парадигмы IL, включая несоответствия инкарнации, обучение с использованием или без использования действий эксперта и работу с недостаточно оптимальными состояниями и действиями эксперта. Он предоставляет базовые показатели для классических методов обратного обучения и адверсариальных подходов IL, включая GAIL, VAIL, GAIfO, IQ-Learn, LS-IQ и SQIL, реализованные с помощью Mushroom-RL.

LocoMuJoCo – это бенчмарк, который включает в себя разнообразные среды, такие как четвероногие, двуногие и мышценапряженные модели человека, сопровождаемые всесторонними наборами данных. С простым интерфейсом для динамической рандомизации и различными частично наблюдаемыми задачами для обучения агентов различными инкарнациями, бенчмарк включает ручные метрики и прогрессивные алгоритмы базового уровня, а также поддерживает различные парадигмы IL. Модель легко расширяется с помощью удобных интерфейсов для RL-библиотек.

LocoMuJoCo – обширный бенчмарк для имитационного обучения в задачах передвижения, предоставляющий разнообразные среды и всесторонние наборы данных. Он облегчает оценку и сравнение алгоритмов IL с помощью ручных метрик, передовых базовых алгоритмов и поддержки различных парадигм IL. Стандарт охватывает четвероногих, двуногих и мышценапряженные модели человека, предлагая частично наблюдаемые задачи для различных инкарнаций. LocoMuJoCo обеспечивает оценку на разных уровнях сложности.

LocoMuJoCo стремится преодолеть ограничения существующих стандартов и облегчить строгую оценку алгоритмов IL. Он включает в себя разнообразные среды, включая четвероногих, двуногих и мышценапряженные модели человека, предлагая всесторонние наборы данных с различными уровнями сложности. Стандарт легко расширяем и совместим с распространенными RL-библиотеками, и исследование отмечает необходимость дальнейших исследований в разработке метрик, основанных на вероятностных распределениях и биомеханических принципах.

В исследовании выделяется открытая проблема в бенчмарках для имитационного обучения, подчеркивая сложность эффективной оценки качества клонированного поведения. Оно призывает к дальнейшему исследованию разработки метрик, основанных на различии между вероятностными распределениями и биомеханическими принципами. Отмечается важность исследования предпочтительных наборов данных экспертов с ранжированием предпочтений в условиях настройки IL на основе предпочтений, особенно когда доступны только недостаточно оптимальные демонстрации. Расширьте бенчмарк, включив больше сред и задач для всесторонней оценки. Работа по исследованию различных алгоритмов IL с использованием многофункционального показателя LocoMuJoCo незамедлительно.