Традиционное машинное обучение все еще актуально?

Все еще актуально традиционное машинное обучение?

“`html

В последние годы генеративный искусственный интеллект (AI) показал многообещающие результаты в решении сложных задач AI. Современные модели AI, такие как ChatGPT, Bard, LLaMA, DALL-E.3 и SAM, показали удивительные возможности в решении мультидисциплинарных проблем, таких как визуальный вопрос-ответ, сегментация, рассуждение и генерация контента.

Кроме того, появились техники мультимодального AI Multimodal AI, способные обрабатывать несколько типов данных одновременно, такие как текст, изображения, аудио и видео. С этими достижениями возникает естественный вопрос: приближаемся ли мы к концу традиционного машинного обучения (ML)?

В этой статье мы рассмотрим состояние традиционного машинного обучения в свете современных инноваций генеративного AI.

Что такое традиционное машинное обучение? – Каковы его ограничения?

Традиционное машинное обучение – это широкий термин, который охватывает широкий спектр алгоритмов, в основном основанных на статистике. Два основных типа традиционных ML-алгоритмов: с контролирующим и не контролирующим. Эти алгоритмы предназначены для разработки моделей на основе структурированных наборов данных.

Стандартные алгоритмы традиционного машинного обучения включают в себя:

  • Алгоритмы регрессии, такие как линейная, лассо и гребневая.
  • Кластеризация K-средних.
  • Анализ главных компонент (PCA).
  • Метод опорных векторов (SVM).
  • Алгоритмы на основе деревьев, такие как деревья решений и случайный лес.
  • Модели бустинга, такие как градиентный бустинг и XGBoost.

Ограничения традиционного машинного обучения

У традиционного ML есть следующие ограничения:

  1. Ограниченная масштабируемость: Эти модели часто требуют помощи для работы с большими и разнообразными наборами данных.
  2. Предварительная обработка данных и инженерия признаков: Традиционное ML требует обширной предварительной обработки для преобразования наборов данных согласно требованиям модели. Кроме того, инженерия признаков может быть трудоемкой и требовать нескольких итераций для выявления сложных взаимосвязей между признаками данных.
  3. Высокоразмерные и неструктурированные данные: Традиционное ML затрудняется работой с комплексными типами данных, такими как изображения, аудио, видео и документы.
  4. Приспособляемость к невидимым данным: Эти модели могут плохо адаптироваться к реальным данным, которые не были частью их обучающих данных.

Нейронная сеть: переход от машинного обучения к глубокому обучению и тому, что за рамками

Нейронная сеть: переход от машинного обучения к глубокому обучению и тому, что за рамками

“`

Модели нейронных сетей (НС) гораздо сложнее, чем традиционные модели машинного обучения. Самая простая НС – многослойный перцептрон (MLP) состоит из нескольких нейронов, соединенных вместе для понимания информации и выполнения задач, аналогично работе человеческого мозга.

Прогресс в техниках нейронных сетей лег в основу перехода от обучения машин к глубинному обучению. Например, НС, используемые для задач компьютерного зрения (обнаружение объектов и сегментация изображений), называются сверточные нейронные сети (CNN), такие как AlexNet, ResNet и YOLO.

Современные технологии генеративного искусственного интеллекта идут дальше и позволяют нейронным сетям превосходить в различных областях искусственного интеллекта. Например, нейронные сети, используемые для задач обработки естественного языка, (такие как текстовое краткое изложение, ответы на вопросы и перевод) называются трансформеры. Заметные модели трансформера включают BERT, GPT-4 и T5. Эти модели оказывают влияние на такие отрасли, как здравоохранение, розничная торговля, маркетинг, финансы и т. д.

Нужны ли нам все еще традиционные алгоритмы машинного обучения?

Нужны ли нам все еще традиционные алгоритмы машинного обучения?

Не смотря на то, что нейронные сети и их современные варианты, такие как трансформеры, привлекли большое внимание, традиционные методы машинного обучения остаются важными. Рассмотрим, почему они все еще актуальны.

1. Простые требования к данным

Нейронные сети требуют больших наборов данных для обучения, в то время как модели машинного обучения могут достигать значительных результатов с помощью меньших и более простых наборов данных. Таким образом, для меньших структурированных наборов данных и наоборот, предпочтение отдается моделям машинного обучения.

2. Простота и интерпретируемость

Традиционные модели машинного обучения основаны на более простых статистических и вероятностных моделях. Например, наилучшая подходящая линия в линейной регрессии устанавливает связь между входом и выходом с помощью метода наименьших квадратов, статистической операции.

Аналогично, деревья решений используют вероятностные принципы для классификации данных. Использование таких принципов обеспечивает интерпретируемость и упрощает понимание работы алгоритмов машинного обучения для специалистов ИИ.

Современные архитектуры НС, такие как трансформеры и модели диффузии (которые обычно используются для генерации изображений, таких как Stable Diffusion или Midjourney), имеют сложную многослойную структуру сети. Для понимания таких сетей требуется понимание сложных математических концепций. Вот почему их также называют “черными ящиками”.

3. Ресурсоэффективность

Современные нейронные сети, такие как большие языковые модели (LLM), обучаются на кластерах дорогостоящих графических процессоров в соответствии с их вычислительными требованиями. Например, GPT4, по данным, обучалась на 25000 видеокартах Nvidia в течение 90-100 дней.

Однако дорогостоящие аппаратные средства и длительное время обучения не являются осуществимыми для каждого практика или команды искусственного интеллекта. С другой стороны, вычислительная эффективность традиционных алгоритмов машинного обучения позволяет практикам достигать значимых результатов даже с ограниченными ресурсами.

4. Не все проблемы требуют глубокого обучения

Глубокое обучение не является абсолютным решением для всех проблем. Имеются определенные сценарии, где методы машинного обучения превосходят глубокое обучение.

Например, в медицинской диагностике и прогнозировании с ограниченными данными алгоритм машинного обучения для выявления аномалий как REMED дает лучшие результаты, чем глубокое обучение. Точно так же традиционное машинное обучение важно в сценариях с низкой вычислительной мощностью как гибкое и эффективное решение.

В первую очередь выбор лучшей модели для любой проблемы зависит от потребностей организации или практикующего и от характера решаемой проблемы.

Машинное обучение в 2023 году

Машинное обучение в 2023 году

Изображение, созданное с использованием Leonardo AI

В 2023 году традиционное машинное обучение продолжает развиваться и конкурировать с глубоким обучением и генеративным искусственным интеллектом. Оно имеет множество применений в промышленности, особенно при работе с структурированными наборами данных.

Например, многие компании продовольственно-бытовых товаров (FMCG) имеют дело с большими объемами табличных данных, полагаясь на алгоритмы машинного обучения для важных задач, таких как персонализированные рекомендации продуктов, оптимизация цен, управление запасами и оптимизация цепи поставок.

Кроме того, многие модели зрения и языка все еще основаны на традиционных методах, предлагая решения в гибридных подходах и новых приложениях. Например, в недавнем исследовании с названием “Нужны ли нам действительно модели глубокого обучения для прогнозирования временных рядов?”, было обсуждено, как градиентный бустинг регрессионных деревьев (GBRT) является более эффективным для прогнозирования временных рядов, чем глубокие нейронные сети.

Интерпретируемость МО остается высоко ценной с помощью таких техник, как SHAP (Shapley Additive Explanations) и LIME (Local Interpretable Model-agnostic Explanations). Эти техники объясняют сложные модели машинного обучения и предоставляют представление о их прогнозах, помогая практикам МО еще лучше понимать модели.

Наконец, традиционное машинное обучение остается надежным решением для различных отраслей, решающими проблемы масштабируемости, сложности данных и ограничений ресурсов. Эти алгоритмы незаменимы для анализа данных и прогнозного моделирования и будут продолжать быть частью арсенала специалистов по обработке данных.

Если вас интересуют подобные темы, изучите Unite AI для получения дополнительных идей.