«Как используются модели фундаментов в играх?»

«Как модели фундаментов применяются в играх?»

Технологии искусственного интеллекта оказывают огромное влияние на различные отрасли, включая медиа и развлечения, автомобильную промышленность, обслуживание клиентов и многое другое. Для разработчиков игр эти достижения открывают путь к созданию более реалистичных и захватывающих игровых переживаний.

От создания живописных персонажей, передающих эмоции, до преобразования обычного текста в привлекательные изображения, фундаментальные модели становятся неотъемлемой частью ускорения рабочих процессов разработчиков при снижении общих затрат. Эти мощные модели искусственного интеллекта открыли множество возможностей, позволяя дизайнерам и разработчикам игр создавать игровые переживания высокого качества.

Что такое фундаментальные модели?

Фундаментальная модель представляет собой нейронную сеть, которая обучается на огромном объеме данных, а затем приспосабливается для выполнения широкого спектра задач. Они способны выполнять различные общие задачи, такие как генерация текста, изображений и звука. За последний год популярность и использование фундаментальных моделей резко возросли, и сейчас сотни таких моделей доступны на рынке.

Например, GPT-4 – это масштабная мультимодель, разработанная OpenAI, которая может генерировать текст, полностью схожий с человеческим, исходя из контекста и предыдущих разговоров. Еще одна модель – DALL-E 3 – может создавать реалистичные изображения и произведения искусства на основе описания, написанного на естественном языке.

Мощные фундаментальные модели, такие как NVIDIA NeMo и модель Edify в NVIDIA Picasso, позволяют компаниям и разработчикам легко внедрять искусственный интеллект в свои рабочие процессы. Например, с помощью фреймворка NVIDIA NeMo организации могут быстро обучать, настраивать и развертывать модели генеративного искусственного интеллекта в большом масштабе. А с помощью NVIDIA Picasso команды могут настраивать предварительно обученные модели Edify с помощью своих собственных предприятий данных для создания пользовательских продуктов и услуг, основанных на генеративном искусственном интеллекте: изображения, видео, 3D-объекты, текстурные материалы и 360 HDRi.

Как создаются фундаментальные модели?

Фундаментальные модели могут использоваться в качестве основы для систем искусственного интеллекта, способных выполнять несколько задач. Организации легко и быстро могут использовать большое количество неотмеченных данных для создания собственных фундаментальных моделей.

Набор данных должен быть как можно больше и разнообразнее, поскольку недостаточное количество данных или данные низкого качества могут привести к неточностям, иногда называемым галлюцинациями, или привести к потере мелких деталей в полученных результатах.

Далее необходимо подготовить набор данных. Это включает очистку данных, удаление ошибок и форматирование таким образом, чтобы их мог понять модель. Проблема смещения (bias) является распространенной при подготовке набора данных, поэтому важно измерять, снижать и устранять эти несоответствия и неточности.

Обучение фундаментальной модели может занимать много времени, особенно учитывая размер модели и количество требуемых данных. Железо, такое как GPU NVIDIA A100 или H100 Tensor Core, вместе с высокопроизводительными системами обработки данных, такими как NVIDIA DGX SuperPOD, способно ускорить процесс обучения. Например, ChatGPT-3 был обучен на более чем 1 000 GPU NVIDIA A100 в течение около 34 дней.

Три основных требования успешной фундаментальной модели.

После проведения обучения фундаментальная модель оценивается по качеству, разнообразию и скорости работы. Существует несколько методов для оценки производительности, например:

  • Инструменты и фреймворки, которые количественно оценивают, насколько хорошо модель предсказывает образец текста
  • Метрики, которые сравнивают созданные результаты с одним или несколькими эталонами и измеряют степень их сходства
  • Оценка качества сгенерированного вывода по различным критериям со стороны человеческого наблюдателя

После прохождения соответствующих тестов и оценок модель может быть развернута в производстве.

Исследование фундаментальных моделей в играх

Предварительно обученные фундаментальные модели могут использоваться промежуточным программным обеспечением, инструментами и разработчиками игр как во время производства, так и во время выполнения. Для обучения базовой модели необходимы ресурсы и время, а также определенный уровень экспертизы. В настоящее время многие разработчики в игровой индустрии интересуются готовыми моделями, но им нужны настраиваемые решения, подходящие для их конкретных случаев использования. Они нуждаются в моделях, обученных на коммерчески безопасных данных и оптимизированных для работы в режиме реального времени, без чрезмерных затрат на развертывание. Сложность удовлетворения этих требований замедляет принятие фундаментальных моделей.

Однако инновации в области генеративного искусственного интеллекта происходят быстро, и как только будут решены основные проблемы, разработчики всех масштабов – от стартапов до AAA-студий – будут использовать базовые модели для повышения эффективности разработки игр и ускорения создания контента. Кроме того, эти модели могут помочь создавать совершенно новые игровые впечатления.

Основные применения в индустрии связаны с использованием интеллектуальных агентов и искусственного интеллекта для создания анимации и создания ресурсов. Например, многие создатели сегодня исследуют модели для создания интеллектуальных неигровых персонажей (NPC).

Настроенные на основе специфических игр пользовательские LLM-модели могут генерировать текст, похожий на человеческий, понимать контекст и отвечать на запросы последовательным образом. Они разработаны для изучения шаблонов и языковых структур, а также для понимания изменений в состоянии игры – развиваясь и двигаясь вместе с игроком в игре.

С увеличением динамических возможностей NPC потребуется анимация и звуковое оформление в режиме реального времени, синхронизированные соответствующими ответами. Разработчики используют NVIDIA Riva для создания выразительных голосов персонажей с помощью речи и искусственного интеллекта перевода. Дизайнеры же обращаются к NVIDIA Audio2Face для создания анимации лица с использованием искусственного интеллекта.

Базовые модели также применяются для создания ресурсов и анимации. Создание ресурсов во время предпроизводства и производства в фазах разработки игр может быть времязатратным, утомительным и дорогостоящим.

Благодаря передовым моделям распространения разработчики могут сделать более быстрые итерации, освободив время для работы над наиболее важными аспектами контент-пайплайна, такими как разработка высококачественных ресурсов и итераций. Возможность настраивать эти модели из собственного хранилища данных студии обеспечивает получение результатов, аналогичных стилю и дизайну их предыдущих игр.

Базовые модели уже доступны, и игровая индустрия только начинает понимать их полные возможности. Существуют разные решения для визуализации в режиме реального времени, но они имеют ограниченное применение. К счастью, разработчики легко могут получить доступ к моделям и микросервисам через облачные API сегодня и изучать, как искусственный интеллект может повлиять на их игры и масштабировать свои решения для большего числа клиентов и устройств, чем когда-либо ранее.

Будущее базовых моделей в геймдеве

Базовые модели готовы помочь разработчикам осуществить будущее игр. Модели распространения и большие языковые модели становятся гораздо более легкими, поскольку разработчики стремятся запускать их нативно на широком спектре аппаратных профилей мощности, включая ПК, консоли и мобильные устройства.

Точность и качество этих моделей будут продолжать улучшаться, по мере того как разработчики будут стремиться генерировать высококачественные ресурсы, требующие минимальной доработки перед выпуском в AAA-игровом опыте.

Базовые модели также будут использоваться в областях, с которыми разработчикам трудно справиться с помощью традиционных технологий. Например, автономные агенты могут помочь анализировать и определять пространство мира во время разработки игр, что ускорит процессы контроля качества.

Развитие мультимодальных базовых моделей, которые могут одновременно обрабатывать текст, изображения, аудио и другие типы ввода, дополнительно улучшит взаимодействие игроков с интеллектуальными NPC и другими игровыми системами. Кроме того, разработчики могут использовать дополнительные типы ввода для улучшения креативности и качества создаваемых ресурсов в процессе производства.

Мультимодальные модели также обещают улучшить анимацию персонажей в режиме реального времени, один из самых трудоемких и дорогостоящих процессов разработки игр. Они могут помочь сделать движение персонажей идентичным движению настоящих актеров, передавать стили и впечатления из разных источников и упростить процесс установки.

Узнайте больше о базовых моделях в геймдеве

Благодаря возможностям по улучшению диалогов и созданию 3D-контента, а также созданию интерактивного геймплея, базовые модели открывают новые возможности для разработчиков и формируют будущее игровых впечатлений.

Узнайте больше о базовых моделях и других технологиях, обеспечивающих рабочие процессы по разработке игр.