Отзывы с участием множества людей помогают обучать роботов
Отзывы, в которых участвует множество людей, способствуют обучению роботов
![В будущем, этот метод может помочь роботу быстро научиться выполнять определенные задачи в доме пользователя, без необходимости владельцу демонстрировать роботу физические примеры каждой задачи. Этот новый подход позволяет собирать обратную связь асинхронно, чтобы пользователи не являющиеся экспертами со всего мира могли внести вклад в обучение агента. ¶ Кредит: Кристин Данилова, MIT/iStock](https://ai.miximages.com/cacm.acm.org/system/assets/0004/6745/120423_iStock_Christine_Daniloff_MIT__faces.large.jpg?1701710004&1701710004)
Метод обучения с подкреплением, разработанный исследователями Массачусетского технологического института (MIT), Гарвардского университета и Университета Вашингтона, обучает роботов с помощью обратной связи, полученной от пользователей-неспециалистов.
Марсель Торне из MIT заявил, что с помощью метода Human Guided Exploration (HuGE) “функция вознаграждения направляет агента к тому, что он должен исследовать, вместо того чтобы точно указывать ему, что он должен сделать, чтобы выполнить задачу”.
Исследователи разделили процесс на две части, используя алгоритм выбора цели, в который непрерывно внедряется отзыв людей, и другой алгоритм, который позволяет искусственному интеллекту исследовать самому направляемому алгоритмом выбора цели.
Как в симуляции, так и на практике, использование метода HuGE позволило агенту достигать целей быстрее, чем другие методы. Источник: MIT News Полный текст статьи
- 15+ Инструментов Искусственного Интеллекта Для Разработчиков (Декабрь 2023)
- OpenAI готовится к запуску GPT-6 и GPT-7 поданы заявки на товарные знаки в Китае.
- Великие новости Google откладывает запуск модели искусственного интеллекта Gemini
Аннотация защищена авторским правом © 2023 SmithBucklin, Вашингтон, США