Сверточные нейронные сети — интуитивно и исчерпывающе объяснены

Сверточные нейронные сети простое и подробное объяснение

Распаковка фундаментальной стратегии моделирования

“Convolved” автором с использованием MidJourney. Все изображения автора, если не указано иное.

Сверточные нейронные сети – это основа компьютерного зрения, обработки сигналов и множества других задач машинного обучения. Они довольно просты и, как следствие, многие принимают их как должное, не понимая их на самом деле. В этой статье мы рассмотрим теорию сверточных сетей доходчиво и исчерпывающе, а также исследуем их применение на нескольких примерах.

Кому это полезно? Всем, кто интересуется компьютерным зрением, сигнальным анализом или машинным обучением.

На каком уровне сложности этот пост? Это очень мощная, но очень простая концепция, отлично подходящая для начинающих. Это также может быть хорошим освежителем для опытных специалистов по анализу данных, особенно при рассмотрении сверток в различных измерениях.

Предварительные требования: Общее представление о обратном распространении ошибки и плотных нейронных сетях может быть полезным, но не обязательным. Я рассматриваю оба из этих аспектов в этой публикации:

Что такое градиенты и почему они взрываются?

Прочитав этот пост, вы будете иметь четкое понимание самой важной концепции в глубоком обучении

towardsdatascience.com

Причина существования сверточных сетей

Первой темой, которой многие начинающие специалисты по анализу данных занимаются, является плотная нейронная сеть. Это классическая нейронная сеть, состоящая из узлов и связей, которые имеют определенные обучаемые параметры. Эти параметры позволяют модели учиться выявлять тонкие взаимосвязи в темах, на которых они обучаются.

Концептуальная диаграмма плотной сети, которая принимает некоторые входные данные и предсказывает вывод. Она изучает необходимые параметры для выполнения задачи путем инкрементного обучения на основе известных примеров (т.е. успешных и неудачных суперкубковых команд предыдущих лет).

При увеличении количества нейронов в сети связи между слоями становятся все более обильными. Это позволяет сложное обоснование, что замечательно, но “плотность” плотных сетей создает проблему при работе с изображениями.

Допустим, мы хотим обучить плотную нейронную сеть предсказывать, содержит ли изображение собаку или нет. Мы могли бы создать плотную сеть, которая рассматривает каждый пиксель изображения…