Начало работы с искусственным интеллектом

Введение в ИИ

Как начать работу над проектом искусственного интеллекта

Фон на Unsplash

Фон

Здесь я предполагаю, что вы прочитали мою предыдущую статью о том, как изучать искусственный интеллект. Напоминаю, что я настоятельно рекомендую обращаться к нескольким источникам (кроме документации), когда изучаете машинное обучение, желательно использовать учебник, соответствующий вашему уровню знаний (начинающий/продвинутый).

Что такое инженерия искусственного интеллекта

Инженерия искусственного интеллекта – это новая дисциплина, сфокусированная на разработке инструментов, систем и процессов для применения искусственного интеллекта в реальных условиях [1]. Вкратце, инженерия искусственного интеллекта – это применение лучших практик разработки программного обеспечения в области искусственного интеллекта.

Искусственный интеллект (AI) vs. Машинное обучение (ML) vs. Глубокое обучение (DL)

Искусственный интеллект (AI) – это изучение способов построения интеллектуальных программ и машин, способных к творческому решению проблем, что всегда считалось прерогативой человека.

Машинное обучение (ML) – это подмножество искусственного интеллекта, которое предоставляет компьютерным системам возможность автоматического обучения и улучшения на основе опыта без явного программирования. В ML существует множество алгоритмов, которые помогают решать проблемы.

Глубокое обучение (DL) – это подмножество машинного обучения, которое использует нейронные сети, имеющие структуру, аналогичную человеческой нервной системе.

Часто возникает путаница между терминами искусственный интеллект и машинное обучение, что обсуждается в процессе искусственного интеллекта.

В аспирантуре курс по искусственному интеллекту обычно включает краткий обзор основных концепций машинного обучения (изучаемых в предыдущих курсах), а затем рассматривает алгоритмы поиска, теорию игр, байесовские сети, процессы принятия Маркова (MDP), обучение с подкреплением и многое другое.

Обзор искусственного интеллекта и машинного обучения в Массачусетском технологическом институте (MIT)

Источник: Toward Data Science

Определение проекта

Первый шаг в проектах искусственного интеллекта – определение проблемы.

В нескольких предложениях опишите следующее:

  • Какая цель? Классификация, предсказание, обнаружение, перевод и т. д.
  • Опишите набор данных, включая входные признаки и целевой(ые) признак(и).
  • Включите сводную статистику данных, включая количество дискретных или категориальных признаков и целевой признак.
  • Будьте готовы поделиться всеми данными. Если вы не можете поделиться набором данных, то следует избегать использования открытых форумов для обсуждения, таких как Slack или Discord.

Как выбрать модель

Каждый новый инженер искусственного интеллекта сталкивается с необходимостью выбора модели для решения проблемы.

Существует множество моделей для выбора, но обычно требуются лишь незначительные изменения, чтобы преобразовать модель регрессии в модель классификации и наоборот.

Процесс искусственного интеллекта описывает процесс инженерии искусственного интеллекта для решения проблем, применимый к практически любой проблеме искусственного интеллекта.

Понимание алгоритмов

Вам необходимо знать, какие алгоритмы доступны для конкретной проблемы, как они работают и как получить максимальную от них пользу. Однако это не означает, что вам нужно писать алгоритмы с нуля. Более важно знать, как использовать надежные библиотеки и фреймворки, такие как scikit-learn и TensorFlow, для решения реальных проблем.

Любой компетентный программист может реализовать любой алгоритм.

Даже если вы опытный инженер по искусственному интеллекту/машинному обучению, вы должны знать производительность более простых моделей на вашем наборе данных/проблеме.

На самом деле, существует много концепций, которые важнее знания того, как работают алгоритмы искусственного интеллекта или как их реализовать (см. Основные концепции в статье Как изучать искусственный интеллект)

Дополнительные ресурсы

У меня есть репозиторий на GitHub с множеством заметок и ссылок на статьи по искусственному интеллекту и машинному обучению по разным темам LearnAI. У меня также есть статья на VoAGI о ресурсах для изучения искусственного интеллекта.

Ссылки

[1] Artificial Intelligence Engineering

[2] J. Brownlee, “Процесс применения машинного обучения,” Machine Learning Mastery, 12 февраля 2014 г.

[3] J. Brownlee, “Как оценивать алгоритмы машинного обучения,” Machine Learning Mastery, 16 августа 2020 г.

[4] Y. Hosni, “Краткое руководство по выбору модели машинного обучения,” MLearning.ai, 4 декабря 2021 г.

[5] M. LeGro, “Интерпретация запутанных результатов множественной линейной регрессии,” Towards Data Science, 12 сентября 2021 г.

[6] E. Alpaydin, Введение в машинное обучение, 3-е изд., MIT Press, ISBN: 978–0262028189, 2014 г.

[7] S. Russell и P. Norvig, Artificial Intelligence: A Modern Approach, 4-е изд., Upper Saddle River, NJ: Prentice Hall, ISBN: 978–0–13–604259–4, 2021 г.

[8] P. Bourque и R. E. Fairley, Руководство к телу знаний по программной инженерии, т. 3, IEEE, 2014 г.

S. Raschka и V. Mirjalili, Python Machine Learning, 2-е изд., Packt, ISBN: 978–1787125933, 2017 г.

W. McKinney, Python for Data Analysis: Обработка данных с помощью Pandas, NumPy и IPython, 2-е изд., O’Reilly Media, ISBN: 978–1491957660, 2017 г.

S. Bird, E. Klein и E. Loper. Обработка естественного языка с использованием Python и Natural Language Toolkit.

D. Jurafsky и J. H. Martin. 2008 г. (2-е издание). Обработка речи и языка. Prentice Hall. ISBN: 978–0131873216.

Y. Hosni, “Конвейер машинного обучения от начала до конца (часть 1),” MLearning.ai, 11 декабря 2021 г.

Y. Hosni, “Конвейер машинного обучения от начала до конца (часть 2),” MLearning.ai, 25 декабря 2021 г.

I. Kilic, “Терминология в области науки о данных – ИИ / МО / ГЛ,” VoAGI, 31 декабря 2021 г.

C. Gulmez, “Как стать разработчиком искусственного интеллекта,” VoAGI, 1 января 2022 г.

D. Gong, “Практическое руководство по линейной регрессии,” Towards Data Science, 18 сентября 2021 г.

Y. Sandeepa, “Регрессия для классификации,” Towards Data Science, 13 сентября 2021 г.

A. Iglesias Moreno, “Проект машинного обучения с начала до конца: отток клиентов телекоммуникационной компании,” Towards Data Science, 23 ноября 2021 г.

M. Di Pietro, “Глубокое обучение на Python: нейронные сети (полное руководство),” Towards Data Science, 17 декабря 2021 г.

D. Poulopoulos, “Как начать вкладываться в проекты с открытым исходным кодом,” Towards Data Science, 30 октября 2021 г.