Неделя основы вернуться обратно 3 Введение в машинное обучение

Введение в машинное обучение Неделя основы вернуться обратно 3

Присоединяйтесь к VoAGI с нашим путем «Возвращение к основам», чтобы начать новую карьеру или освежить свои навыки в области науки о данных. Путь «Возвращение к основам» разделен на 4 недели с бонусной неделей. Мы надеемся, что вы сможете использовать эти блоги в качестве руководства по курсу.

Если вы еще этого не сделали, ознакомьтесь с:

Перейдем к третьей неделе, где мы изучим машинное обучение.

  • День 1: Расшифровка машинного обучения
  • День 2: Начало работы с Scikit-learn за 5 шагов
  • День 3: Понимание обучения с учителем: теория и обзор
  • День 4: Практическое применение обучения с учителем: линейная регрессия
  • День 5: Раскрытие ненадзорного обучения
  • День 6: Практическое применение ненадзорного обучения: кластеризация K-средних
  • День 7: Метрики оценки машинного обучения: теория и обзор

Расшифровка машинного обучения

Неделя 3 – Часть 1: Расшифровка машинного обучения

Традиционно, компьютеры следовали явно заданным инструкциям. Например, если вы хотели, чтобы компьютер выполнил простую задачу сложения двух чисел, вам приходилось перечислять каждый шаг. Однако, с появлением все более сложных данных, такой мануальный подход к даче инструкций стал недостаточным.

Именно здесь машинное обучение стало переломным моментом. Мы хотели, чтобы компьютеры учились на примерах, так же, как мы учимся на своем опыте. Представьте себе, что вы обучаете ребенка ездить на велосипеде, показывая ему несколько раз, а затем позволяя ему упасть, разобраться и научиться самостоятельно. Именно это идея стоит за машинным обучением. Это новшество не только преобразовало отрасли, но стало неотъемлемой необходимостью в современном мире.

Начало работы с Scikit-learn за 5 шагов

Неделя 3 – Часть 2: Начало работы с Scikit-learn за 5 шагов

Этот учебник предлагает всеобъемлющее практическое руководство по машинному обучению с использованием Scikit-learn. Читатели изучат ключевые концепции и методы, включая предобработку данных, обучение и оценку моделей, настройку гиперпараметров и построение ансамблевых моделей для повышения производительности.

Изучая, как использовать Scikit-learn, мы, очевидно, должны уже иметь понимание основных концепций машинного обучения, так как Scikit-learn – это всего лишь практический инструмент для реализации принципов машинного обучения и связанных задач. Машинное обучение – это подраздел искусственного интеллекта, который позволяет компьютерам учиться и совершенствоваться на основе опыта, без явного программирования. Алгоритмы используют обучающие данные для прогнозирования или принятия решений, раскрывая закономерности и понимание.

Понимание обучения с учителем: теория и обзор

Неделя 3 – Часть 3: Понимание обучения с учителем: теория и обзор

Обучение с учителем – это подкатегория машинного обучения, при которой компьютер учится по маркированному набору данных, содержащему как вход, так и правильный выход. Он пытается найти функцию отображения, связывающую вход (x) с выходом (y). Можно представить себе, что вы обучаете своего младшего брата или сестру распознавать различных животных. Вы покажете им некоторые картинки (x) и расскажете им, как называется каждое животное (y).

По истечении определенного времени они научатся различать отличия и смогут правильно распознавать новые изображения. Это основной интуитивный подход к обучению с учителем.

 

Практическое знакомство с обучением с учителем: линейная регрессия

 

Неделя 3 – Часть 4: Практическое знакомство с обучением с учителем: линейная регрессия

Если вы ищете практический опыт с подробным, но простым для новичков учебником по реализации линейной регрессии с использованием Scikit-learn, вам предстоит интересное путешествие.

Линейная регрессия является основным алгоритмом обучения с учителем для прогнозирования непрерывной целевой переменной на основе входных признаков. Как следует из названия, он предполагает, что отношение между зависимой и независимой переменной является линейным.

Поэтому, если мы попытаемся построить график зависимой переменной Y от независимой переменной X, мы получим прямую линию.

 

Раскрытие без учителя

 

Неделя 3 – Часть 5: Раскрытие без учителя

Изучите парадигму обучения без учителя. Ознакомьтесь с основными концепциями, техниками и популярными алгоритмами обучения без учителя.

В машинном обучении обучение без учителя – это парадигма, которая предполагает обучение алгоритма на неразмеченном наборе данных. Таким образом, отсутствует наблюдение или размеченные выходные данные.

В обучении без учителя цель заключается в обнаружении закономерностей, структур или отношений внутри самих данных, а не в предсказании или классификации на основе размеченных примеров. Это позволяет исследовать внутреннюю структуру данных, чтобы получить информацию и понять сложную информацию.

 

Практическое знакомство с обучением без учителя: кластеризация K-средних

 

Неделя 3 – Часть 6: Практическое знакомство с обучением без учителя: кластеризация K-средних

Этот учебник предоставляет практический опыт работы с ключевыми концепциями и реализацией алгоритма кластеризации K-средних, популярного алгоритма обучения без учителя, для сегментации клиентов и нацеленной рекламы.

Кластеризация K-средних является одним из наиболее часто используемых алгоритмов обучения без учителя в науке о данных. Он используется для автоматического сегментирования наборов данных на кластеры или группы на основе сходства между точками данных.

В этом коротком учебнике мы узнаем, как работает алгоритм кластеризации K-средних и применим его к реальным данным с использованием scikit-learn. Кроме того, мы визуализируем результаты, чтобы понять распределение данных.

 

Метрики оценки машинного обучения: теория и обзор

 

Неделя 3 – Часть 7: Метрики оценки машинного обучения: теория и обзор

Высокоуровневое исследование метрик оценки в машинном обучении и их важность.

Построение модели машинного обучения, которая хорошо обобщается на новые данные, является очень сложной задачей. Ее необходимо оценивать, чтобы понять, достаточно ли хороша модель или требуется внесение некоторых изменений для повышения производительности.

Если модель недостаточно учитывает особенности обучающего набора, она плохо справляется как с обучающим, так и с тестовым наборами данных. Это так называемая проблема недообучения.

Слишком большое изучение особенностей обучающих данных, даже шума, приведет к тому, что модель будет хорошо справляться с обучающим набором данных, но плохо работать на тестовом наборе данных. Это состояние называется переобучением. Обобщение модели может быть достигнуто, если показатели производительности на обучающем и тестовом наборах данных будут схожи.

 

Завершение

 

Поздравляем с завершением недели 3!!

Команда VoAGI надеется, что курс “Back to Basics” помог читателям получить исчерпывающий и структурированный подход к основам науки о данных.

Неделя 4 будет размещена на следующей неделе в понедельник – оставайтесь на связи!

****[Ниша Арья](https://www.linkedin.com/in/nisha-arya-ahmed/)**** – это ученый по данным и фриланс-технический писатель. Она особенно заинтересована в предоставлении карьерных советов или учебников в области науки о данных и теоретических знаний по науке о данных. Она также хочет исследовать различные способы, которыми искусственный интеллект может быть полезен для продолжительности человеческой жизни. Она усердно учится, стремится расширить свои технические знания и навыки письма, помогая вести других.