Расшифровка машинного обучения

Machine Learning Decryption

 

Традиция против Трансформации: Огляд назад и вперед

 

Традиционно компьютеры следовали явному набору инструкций. Например, если вы хотели, чтобы компьютер выполнил простую задачу сложения двух чисел, вам нужно было перечислить каждый шаг. Однако по мере усложнения наших данных, этот ручной подход к даче инструкций для каждой ситуации стал недостаточным.

Здесь и возникло понятие Машинного обучения, которое стало своего рода игровым переворотом. Мы хотели, чтобы компьютеры учились на примерах, так же, как мы учимся на своем опыте. Представьте себе, как вы учите ребенка ездить на велосипеде, показывая ему это несколько раз и затем позволяя ему упасть, разобраться и научиться самостоятельно. Вот идея Машинного обучения. Эта инновация не только преобразовала отрасли, но и стала неотъемлемой необходимостью в современном мире.

 

Изучение Основ

 

Теперь, когда у нас есть базовое понимание термина “Машинное обучение”, давайте ознакомимся с некоторыми фундаментальными терминами:

 

Данные

 

Данные – это кровь Машинного обучения. Это относится к информации, которую компьютер использует для обучения. Эта информация может быть числами, изображениями или чем-то еще, что компьютер может понять. Она дополнительно разделяется на 2 категории:

  • Обучающие данные: Эти данные относятся к примерам, которые мы используем для обучения компьютера.
  • Тестовые данные: После обучения мы проверяем производительность компьютера с помощью новых, неизвестных данных, называемых тестовыми данными.

 

Метки и Характеристики

 

Представьте, что вы учитесь ребенка отличать разных животных. Названия животных (собака, кошка и т. д.) будут метками, а характеристики этих животных (количество ног, шерсть и т. д.), которые помогают вам их распознать, будут характеристиками.

 

Модели

 

Это результат процесса Машинного обучения. Это математическое представление паттернов и связей в данных. Это похоже на создание карты после исследования нового места.

 

Типы Машинного обучения

 

Существуют четыре основных типа Машинного обучения:

 

Обучение с учителем

 

Оно также называется управляемым обучением. Мы предоставляем размеченный набор данных нашему алгоритму Машинного обучения, где правильный вывод уже известен. Основываясь на этих примерах, алгоритм учится скрытым паттернам в данных и может предсказывать или правильно классифицировать новые данные. Общие категории в рамках обучения с учителем:

  • Классификация: Разделение вещей на отдельные категории, например, классификация картинок как котов или собак, электронных писем как спама или не спама и т. д.
  • Регрессия: Предсказание числовых значений, например, цены дома, вашего среднего балла или количества продаж на основе определенных характеристик.

 

Обучение без учителя

 

Здесь компьютеру предоставляются неразмеченные данные без предварительных подсказок, и он самостоятельно исследует скрытые паттерны. Просто представьте, что вам дали коробку пазлов без картинки, и ваша задача – сгруппировать похожие картинки, чтобы получить полное изображение. Кластеризация является наиболее распространенным типом обучения без учителя, где похожие точки данных объединяются в группу. Например, мы можем использовать кластеризацию для группировки похожих видов социальных медиа-постов, и пользователи могут следить за подтемами, которые их интересуют.

 

Полу-обучение

 

Полу-обучение содержит смесь размеченных и неразмеченных наборов данных, где размеченный набор данных выступает в качестве ориентира для определения паттернов в данных. Например, вы даете повару список основных ингредиентов для использования, но не предоставляете полного рецепта. Так что хотя у них и нет рецепта, есть некоторые подсказки, которые могут помочь им начать.

 

Обучение с подкреплением

 

Обучение с подкреплением также называется обучением на практике. Оно взаимодействует с окружающей средой и получает вознаграждение в виде наказания за свои действия. Со временем оно учится максимизировать вознаграждение и хорошо выполнять задачи. Представьте, что вы тренируете щенка и даете положительную обратную связь, вознаграждая его, когда он ведет себя хорошо, и отрицательную обратную связь в виде удержания вознаграждения. С течением времени щенок учится действиям, которые приводят к вознаграждению, а также тем, которые этого не делают.

 

Процесс машинного обучения высокого уровня

 

Машинное обучение, подобно искусству готовки, обладает волшебной способностью превращать сырые, разнородные элементы в глубокие идеи. Точно так же, как опытный повар искусно сочетает различные ингредиенты, чтобы создать вкусное блюдо. Вот 6 основных шагов, используемых для выполнения задачи машинного обучения:  

 

1. Сбор данных

 

Данные – это важный ресурс, и их качество имеет большое значение. Разнообразные, более актуальные данные дают лучшие результаты. Можно представить себе, что это подобно сбору различных ингредиентов у шеф-повара на разных рынках.

 

2. Предобработка данных

 

Большая часть наших данных не находится в нужной форме. Подобно мытью, нарезке и приготовлению ингредиентов перед приготовлением пищи, предобработка данных включает в себя очистку и организацию данных для процесса обучения. Некоторые распространенные проблемы, с которыми вы можете столкнуться, – это отсутствующие данные, выбросы, неправильный формат и т. Д.

 

3. Выбор алгоритма

 

Подобно выбору рецепта для конкретного блюда, вы выбираете алгоритм на основе проблемы, которую пытаетесь решить. Этот выбор может также быть влиянием типа данных, которыми вы располагаете.

 

4. Обучение модели

 

Подумайте о нем как о процессе приготовления пищи, когда мы ждем, пока смешаются ароматы. Аналогично мы позволяем модели учиться на тренировочных данных. Важная концепция скорости обучения также применяется здесь, определяющая, насколько большим шагом ваша модель делает на каждой итерации обучения. Если добавить слишком много соли или специй сразу, блюдо может стать чрезмерно ароматным. Напротив, если добавить слишком мало, ароматы могут не полностью раскрыться. Скорость обучения находит идеальный баланс для постепенного повышения аромата.

 

5. Тестирование и оценка

 

По окончании процесса обучения мы проверяем его с помощью специальных тестовых данных, подобно тому, как мы пробуем блюдо и рассматриваем его внешний вид, прежде чем поделиться им с другими. Общие метрики оценки включают точность, точность, полноту и F1-оценку, в зависимости от решаемой проблемы.

 

6. Настройка и итерация

 

Регулировка приправ или ингредиентов, чтобы совершенствовать блюдо, вы настраиваете свои модели, вводя больше переменных, выбирая другой алгоритм обучения и регулируя параметры или скорость обучения.

 

Заключение

 

По мере завершения нашего изучения основ машинного обучения, помните, что все дело в том, чтобы дать компьютерам возможность учиться и принимать решения с минимальным вмешательством человека. Будьте любопытны и следите за нашими следующими статьями, где мы более подробно рассмотрим различные типы алгоритмов машинного обучения. Вот несколько ресурсов для новичков, которые вы можете изучить далее:

  • Введение в машинное обучение с помощью Python
  • Машинное обучение для абсолютных начинающих
  • Машинное обучение – Coursera
  • Практическое машинное обучение с использованием Scikit-Learn, Keras и TensorFlow

    Канвал Мехрин – начинающий разработчик программного обеспечения с большим интересом к науке о данных и применению искусственного интеллекта в медицине. Канвал была выбрана Google Generation Scholar 2022 для региона APAC. Канвал любит делиться техническими знаниями, писав статьи по актуальным темам, и страстно занимается улучшением представительства женщин в технической индустрии.