Исследователи Массачусетского технологического института разработали технику искусственного интеллекта (ИИ), которая позволяет роботу разрабатывать сложные планы для манипулирования объектом, используя всю свою руку.
Исследователи Массачусетского технологического института разработали ИИ для манипулирования объектом с помощью всей руки робота.
Цельно-телесная манипуляция – это сила человека, но слабость роботов. Робот интерпретирует каждую возможную точку контакта между коробкой и пальцами, руками или торсом носильщика как отдельное контактное событие. Эта задача становится сложной для подготовки, как только рассматриваются миллиарды возможных контактных событий. Теперь исследователи из MIT могут упростить эту технику, называемую планированием манипуляции с богатым контактом. Для сокращения количества необходимых оценок для нахождения хорошего плана манипуляции для робота из огромного количества контактных случаев используется метод искусственного интеллекта под названием сглаживание.
Новые разработки в области RL продемонстрировали удивительные результаты в манипулировании через контакт-богатую динамику, что ранее было сложно достичь с использованием модельно-ориентированных техник. Хотя эти техники были эффективными, пока не было известно, почему они достигли успеха, в то время как модельно-ориентированные подходы потерпели неудачу. Общая цель состоит в том, чтобы понять и осознать эти факторы с точки зрения модельно-ориентированного подхода. Исходя из этих пониманий, ученые работают над объединением эмпирического успеха RL с обобщаемостью и эффективностью моделей.
Гибридный характер контактной динамики представляет наибольшую проблему для планирования прикосновения с точки зрения модельно-ориентированного подхода. Поскольку последующая динамика не является гладкой, локально уже не действительно приближение Тейлора, а линейная модель, построенная с использованием градиента, быстро разрушается. Поскольку как и итеративная оптимизация на основе градиента, так и планирование на основе выборки используют локальные метрики расстояния, недействительность локальной модели создает серьезные трудности для обоих. В ответ на эти проблемы множество публикаций попытались учесть контактные режимы, либо перечисляя их, либо предоставляя примеры. Эти планировщики, которые обладают модельно-ориентированным пониманием динамических режимов, часто переключаются между планированием с непрерывным состоянием в текущем контактном режиме и дискретным поиском следующего режима, что приводит к траекториям с небольшим количеством переключений режимов.
- Это исследование ИИ от MIT демонстрирует, как система машинного обучения, основанная на свете, может привести к созданию более мощных и эффективных моделей больших языковых моделей.
- Исследователи в лаборатории искусственного интеллекта Tencent представляют IP-адаптер адаптер текстово-совместимого изображения для моделей диффузии текста в изображение.
- Исследователи компании Apple предлагают сеть с конца в конец, создающую подробные 3D-реконструкции на основе заданных изображений
Первое, что исследователи добавили, – это доказательство того, что две стратегии сглаживания теоретически эквивалентны для базовых систем в рамках этой модели. Кроме того, с использованием этой модели авторы демонстрируют, как эффективно вычислять локально-линейные модели (т. е. градиенты) сглаженной динамики в режиме реального времени, и они демонстрируют, что качественные характеристики и эмпирическая производительность двух схем сглаживания сопоставимы в различных сложных примерах.
Второе улучшение – это полная модель контактной динамики. В частности, они предлагают неявную модель контакта с пошаговым временем, которая является выпуклой. Релаксация фрикционного контакта Анитеску приводит к выпуклости. Однако она действительно вводит некоторое слабо нереалистичное поведение на практике. По сравнению с обычной формулировкой линейной задачи о дополнительности (LCP) выпуклость предлагает значительные численные преимущества.
При моделировании роботизированной манипуляции обычно используется квази-динамическое предположение, поскольку оно позволяет предсказуемость в долгосрочной перспективе. В квази-динамических моделях нет необходимости в переменных, представляющих скорость или затухание, поскольку кинетическая энергия теряется на каждом временном шаге. Они проверяют и тестируют квази-динамическую контактную модель путем моделирования и выполнения тех же входных траекторий в Drake, высокоточном симуляторе второго порядка на аппаратном обеспечении. Если система, рассматриваемая, имеет высокое затухание и контролируется трением, результаты показывают, что модель лучше приближает динамику второго порядка.
Кроме того, для аналитического смягчения контактной модели может использоваться логарифмическая барьерная релаксация. Как и в типичном методе внутренней точки для выпуклых систем, в этой стратегии смягчения для гибкого соблюдения жестких контактных ограничений используется логарифмическая барьерная функция. Дальнейшая работа демонстрирует, что теорема неявной функции предоставляет простой метод для вычисления градиентов сглаженной контактной модели. Наконец, эксперты считают, что одним из основных элементов эмпирического успеха RL является его цель выполнения глобальной оптимизации с использованием стохастичности. Планирование нелинейной динамики с использованием детерминированных моделей обычно приводит к не выпуклым задачам оптимизации, где качество многих локальных минимумов может быть решающим.
Последний вклад решает этот недостаток, объединяя возможности глобального поиска RRT с абстракцией контактных режимов на основе сглаживания. Используя новую меру расстояния, происходящую от локальных сглаженных моделей, исследователи сделали возможным для RRT искать в пределах, накладываемых контактной динамикой.
Общий вклад
Ученые определяют качественное и эмпирическое эквивалентность случайных и аналитических методов сглаживания на простых системах.
Они показывают, что планирование манипуляций с богатым контактом может значительно выиграть от выпуклой, дифференцируемой формулировки квазидинамической динамики контакта и связанного с ней аналитического сглаживания.
Исследователи интегрируют сглаживание контактных режимов с планированием движения на основе выборки для достижения эффективного глобального планирования с использованием богатой динамики контакта, заполняя пробел в спектре существующих подходов.
Исследователи уточняют математическое значение сглаживания функции и несколько стратегий для вычисления ее локальных приближений, прежде чем обсуждать контакт в сложных системах. Их цель состоит в представлении объединенной картины техник сглаживания и связей между ними.
Исследователи вдохновлены различием в успехе RL в эмпирических ситуациях с большим количеством человеческого контакта и неудачей модельных подходов. Они показали, что традиционные модельные подходы могут эффективно справляться с планированием манипуляций с богатым контактом, идентифицируя проблемы в существующих модельных методах планирования, понимая, как RL смог обойти такие препятствия, и разрешая их с помощью модельных техник. Обеспечивая эффективное онлайн-планирование в течение минуты и обобщаемость в отношении сред и задач, данное исследование предлагает мощную альтернативу существующим инструментам в RL, которые полагаются на тяжелые оффлайн-вычисления в течение нескольких часов или дней. Исследователи рассматривают некоторые факторы, которые сделали это возможным.
Вкратце, исследователи вдохновились этим исследованием после осознания значительной разницы между успехом RL в эмпирических контекстах и борьбой модельных подходов с этой проблемой. Они показали, что традиционные модельные подходы могут эффективно справляться с планированием манипуляций с богатым контактом, идентифицируя проблемы в существующих модельных методах планирования, понимая, как RL смог обойти такие проблемы, и разрешая их с помощью модельных техник. Обеспечивая эффективное онлайн-планирование в течение минуты и обобщаемость в отношении сред и задач, данное исследование предлагает мощную альтернативу существующим инструментам в RL, которые полагаются на тяжелые оффлайн-вычисления в течение нескольких часов или дней. Исследователи рассматривают некоторые факторы, которые сделали это возможным.
Изначально идентифицированная как недостаток модельных подходов, необходимость явного перечисления и оценки режимов была смягчена стохастическим сглаживанием RL. Затем они указали на другой недостаток модельных техник: вторичные переходные процессы могут вызывать краткосрочные линеаризации, которые не помогают с долгосрочной стратегией. Они предложили модель Convex Differentiable Quasi-Dynamic Contact (CQDC), чтобы устранить этот недостаток. Они продемонстрировали полезность модели контакта через множество теоретических аргументов и экспериментов. Они также показали, что динамику контакта можно аналитически смягчить с помощью логарифмического барьера, оценив сначала структуру модели. Они провели исследования, демонстрирующие преимущества аналитического сглаживания перед случайным сглаживанием.
В заключение, они обнаружили, что стратегии на основе сглаживания, основанные на модели, были связаны с локальной оптимизацией траекторий. По сравнению с техниками на основе RL, которые пытаются выполнить глобальный поиск, они оказались менее успешными в сложных задачах из-за их подверженности локальным минимумам. Однако техники SBMP для систем с богатым контактом избежали ловушки перечисления режимов, явно учитывая контактные режимы. Работа вносит вклад, закрывая пробел в существующих подходах путем объединения сглаживания режимов с RRT, где фаза исследования RRT была направлена локальным приближением гладкой замены на основе локальной метрики Махаланобиса. Комбинируя эти три преимущества, исследователи сделали возможным эффективное глобальное планирование движения для систем с богатым контактом и высокой размерностью с использованием модельных и RL-подходов. В будущем они планируют использовать высокооптимизированную версию планировщика для поиска политик или выполнения планирования движения в реальном времени. Они ожидают, что такое улучшение позволит роботам находить контактные конструкции в реальном времени в ранее неисследованных областях всего за несколько секунд планирования.