Hands-On Deep Q-Learning’ (Практическое освоение глубокого Q-обучения)

Погружение в глубокое Q-обучение практические навыки

УСИЛЕННОЕ ОБУЧЕНИЕ

Улучшите своего агента, чтобы выигрывать более сложные игры!

Фото Сона Страттона на Unsplash — Фото от Сона Страттона на Unsplash

Усиленное обучение – одна из самых увлекательных областей машинного обучения. В отличие от обучения с учителем, модели усиленного обучения могут самостоятельно изучать сложные процессы, даже без аккуратно табулированных данных.

Для меня самое интересное – видеть, как агенты искусственного интеллекта выигрывают видеоигры, но усиленное обучение также может использоваться для решения бизнес-задач. Просто представьте это как игру, и вперед! Вам нужно всего лишь определить…

среду, в которой живет ваш агент,
какие решения может принимать ваш агент, и
каковы критерии успеха и неудачи.

Пример агента искусственного интеллекта, овладевающего игрой. Заберите клиента и доставьте его в отель. Изображение автора.

Прежде чем продолжить, пожалуйста, прочтите мою вводную статью об усиленном обучении. Она даст вам больше контекста и покажет, как провести простую и эффективную форму усиленного обучения самостоятельно. Она также служит основой для этой статьи.

Практическое руководство по усиленному обучению

Сделайте первые шаги в написании успешных AI-агентов для игр

towardsdatascience.com

В этой статье вы узнаете о глубоком Q-обучении, почему нам это нужно и как реализовать его самостоятельно, чтобы овладеть игрой, которая кажется намного сложнее, чем в моей другой статье.

Вы можете найти код на моем Github.

Большие пространства наблюдений

В связанной выше статье мы использовали Q-обучение для того, чтобы агент играл в простые игры с небольшими дискретными пространствами наблюдений. В игре Frozen Lake, например, есть 16 полей (=состояний или наблюдений, я буду использовать эти термины взаимозаменяемо) на 4×4 карте. В версии карточной игры Blackjack в программном обеспечении gymnasium есть 32 · 11 · 2 = 704 состояния.

Hands-On Deep Q-Learning’ (Практическое освоение глубокого Q-обучения)

Погружение в глубокое Q-обучение практические навыки

УСИЛЕННОЕ ОБУЧЕНИЕ

Улучшите своего агента, чтобы выигрывать более сложные игры!

Практическое руководство по усиленному обучению

Сделайте первые шаги в написании успешных AI-агентов для игр

Большие пространства наблюдений

Неэффективность Q-обучения

Ложный пророк Сравнение регрессионной модели с Пророком Меты

Познакомьтесь с HyperHuman новейшей системой AI для генерации гиперреалистичных изображений людей с помощью латентной структурной диффузии.

Как именно дерево решений решает проблему р...

Используйте API синонимов для удобного обно...

Улучшение производительности и обоснованнос...

Учебник Sklearn Модуль 2

Google DeepMind представляет Lyria революци...

Удаленная работа в области Data Science плю...

Наука о данных