Алгоритм обучения, вдохновленный мозгом, позволяет метапластичность в искусственных и спайковых нейронных сетях

Мозго-вдохновленный алгоритм обучения для искусственных и спайковых нейронных сетей с метапластичностью

Оценка кредитования в нейронных сетях для исправления глобальных ошибок вывода была определена с использованием множества правил пластичности синапсов в естественных нейронных сетях. Краткосрочная пластичность, Хеббово обучение и пластичность, зависящая от времени спайков (STDP), были основными фокусами предыдущих попыток внедрения биологически значимых принципов пластичности в спайковые и неспайковые НС. STDP выходит за рамки Хеббового обучения, учитывая временной порядок спайков до и после синапсов для изменения синапсов. Правила пластичности синапсов в обоих случаях основаны исключительно на локальной нейронной активности, а не на точном представлении глобальных инструкционных сообщений. Нейромодуляторы, такие как дофамин, норадреналин, серотонин и ацетилхолин, действуют на множество синапсов и поступают из широко рассеянных аксонов определенных нейромодуляторных нейронов, чтобы производить глобальную модуляцию синапсов во время обучения, связанного с вознаграждением.

Методы биологической нейромодуляции вдохновили несколько алгоритмов пластичности в моделях нейронных сетей. Между Хеббовой модификацией и вознаграждением существует значительная задержка, но это правило вдохновило другие формы обучения с подкреплением. Например, трехфакторное правило для обучения с подкреплением использует нейронную активность до и после синапса в качестве первых двух факторов и дистальный вознаграждающий нейромодуляторный уровень в качестве третьего фактора. Модели следовательности элегантности хранят запись о предыдущих одновременно происходящих до- и постсинаптических спайках, чтобы упростить отложенные вознаграждения, зависящие от спайков. Амплитуда и полярность синапсов были определены в моделях вычислительной нейронауки на уровне нейромодулятора, но эти методы все еще нужно включить в НС или СНС. Когда речь идет о обучении с учителем распознавания изображений и речи, алгоритм NACA не только значительно снизил проблему катастрофического забывания во время класса-CL, но и повысил точность распознавания и снизил вычислительные затраты. Изменения веса синапсов в скрытом слое были дополнительно отображены, показывая, что распределение изменений веса NACA избегает чрезмерной синаптической потенциации или депрессии, защищая при этом большую часть синапсов с незначительными корректировками. Наши результаты вместе представляют новый алгоритм, вдохновленный мозгом, для ожидаемой глобальной нейромодуляции пластичности синапсов, который позволяет достигать высокой точности и низких вычислительных затрат в нейронных сетях во множестве задач распознавания и непрерывного обучения.

Для решения проблемы катастрофического забывания в СНС и СНН исследователи из Института автоматизации Китайской академии наук представили новый подход к обучению, вдохновленный мозгом (NACA) на основе пластичности, зависящей от нейромодуляции.

Эта техника основана на математической модели пути нейромодуляции в форме кодирования антиципирующей матрицы, которая, в свою очередь, основана на структуре пути нейромодуляции мозга. В ответ на сигнал стимула создаются допаминовые регулирующие сигналы разной силы, которые влияют на пластичность близлежащих нейронов и синапсов.

Как СНС, так и СНН могут обучаться с помощью поддержки NACA чистых техник обучения прямого распространения. Он синхронизируется с входным сигналом и даже пропагирует информацию до завершения входящего вызова. NACA продемонстрировал значительные преимущества быстрой сходимости и сокращения катастрофического забывания при совместном использовании с изменением пластичности, зависящим от времени спайков. Кроме того, исследовательская группа расширила нейромодуляцию на диапазон нейронной пластичности и протестировала способность непрерывного обучения NACA в классе непрерывного обучения.

Исследователи определили уровень нейромодуляторов в подпопуляциях синапсов в скрытом и выходном слоях во время обучения сети с использованием алгоритма NACA, учитывая тип ввода и ошибку вывода. Зависимость эффективности синапсов от уровня нейромодуляторов или кальция вдохновила нелинейную модуляцию амплитуды и полярности долгосрочной потенциации (LTP) и депрессии (LTD) на каждом синапсе в СНН. Например, допаминовое связывание с синапсами, содержащими рецепторы D1-подобного или D2-подобного типов, может варьировать активацию внутриклеточных сигнальных каскадов, что приводит к модификации активности, вызванной LTP или LTD.

Мы внедрили нейромодуляцию, зависящую от синаптической пластичности, в алгоритм обучения под названием NACA для СНН и СНС. Мы обнаружили значительные улучшения точности и драматическое снижение вычислительных затрат при применении сети к обычным задачам распознавания изображений и речи. Техника NACA значительно снизила катастрофическое забывание в пяти задачах класса-CL различной сложности. В то время как другие алгоритмы обучения сетей, вдохновленные нейромодуляцией, такие как глобальная теория рабочего пространства нейронов в спайковых нейронных сетях (СНС) и нейромодуляция вероятности отсева в искусственных нейронных сетях (СНС), были разработаны, NACA выделяется тремя особыми качествами, которые могут способствовать его успеху. Уровень нейромодулятора в определенных нейронах и синапсах скрытого и выходного слоев настроен в соответствии с ожиданиями на основе типа входа и ошибки вывода. Во-вторых, уровень нейромодулятора нелинейно влияет на локальную синаптическую пластичность, такую как LTP или LTD. В-третьих, глобальное обратное распространение ошибочных сигналов не имеет значения для обучения сети, что полностью зависит от локальной пластичности.

Алгоритм NACA значительно снизил вычислительные затраты всех задач по сравнению с существующими алгоритмами обучения. Использование NACA помогло снизить крайнюю забывчивость, которая часто возникает при непрерывном обучении. Дальнейшее отображение изменений синаптической весовой функции на синапсах скрытого слоя во время класса CL показало, что NACA приводит к нормально распределенным изменениям синаптической весовой функции без чрезмерного усиления или угнетения и сохраняет множество синапсов с минимальными изменениями во время класса CL. Возможность NACA снижать крайнюю амнезию может основываться на том, как распределяются изменения в синаптической весовой функции.

Ниже приведены некоторые ограничения, накладываемые на предлагаемый алгоритм NACA:

  • Во-первых, в более глубоких нейронных сетях алгоритм NACA проявляет некоторую нестабильность во время нейромодуляции синаптических изменений. В начальных эпохах, например, параллельная нейромодуляция на синапсах многих слоев приводит к временному снижению точности тестирования.
  • Во-вторых, согласно предиктивному кодированию, алгоритм NACA не легко интегрируется с традиционным алгоритмом обратного распространения ошибки, поскольку его глобальная нейромодуляция происходит одновременно или даже раньше локального распространения импульсов.
  • В-третьих, NACA представляет и исследует только возбуждающие нейроны LIF и один тип нейромодулятора, не рассматривая взаимодействие нейромодуляций от нескольких типов нейронов.

Алгоритм NACA, который включает правила обучения, основанные на биологических предпосылках, без применения глобальных вычислений градиента, может обеспечить обучение сети для SNN и ANN, чтобы подытожить. Он демонстрирует, что высокая эффективность и низкая вычислительная стоимость в машинном обучении могут быть достигнуты с помощью методов, вдохновленных мозгом. Алгоритм NACA, если он будет реализован на нейроморфных устройствах, может проложить путь к онлайн-системам непрерывного обучения, которые являются энерго- и времеэффективными. Рассмотренный с позиции вычислительной нейронауки, успех NACA доказывает, что гибкость нейронных цепей мозга для непрерывного обучения может проистекать из метапластичности локальной пластичности.