Исследователи изучают тензорные сети для интерпретируемого и эффективного машинного обучения, вдохновленного квантовой физикой.

Исследователи применяют тензорные сети для интерпретируемого и эффективного машинного обучения, вдохновленные квантовой физикой.

Компьютерное зрение, NLP и другие области имеют замечательный успех с глубокими методами машинного обучения (ML) на основе глубоких нейронных сетей (NN). Однако долгосрочная проблема интерпретируемости против эффективности представляет собой несколько существенных препятствий. Возможность задавать вопросы, понимать и доверять глубоким методам ML зависит от их интерпретируемости, часто описываемой как степень, с которой человек может понять источник вывода.

Вероятностные модели машинного обучения, такие как байесовские сети, машины Больцмана и другие, считаются “белыми ящиками”, поскольку они по своей сути интерпретируемы. Одним из способов интерпретации этих моделей является использование вероятностного вывода для раскрытия скрытых причинно-следственных связей; это соответствует статистической работе человеческого разума. К сожалению, передовые глубокие нейронные сети значительно превосходят эти вероятностные модели. Похоже, что текущие модели машинного обучения не могут одновременно достичь высокой эффективности и интерпретируемости.

Благодаря экспоненциальному росту квантовых и классических вычислений возникло новое средство для решения противоречия между эффективностью и интерпретируемостью: тензорные сети (TN). Процесс соединения более одного тензора называется TN. Путь, по которому тензоры соединяются, определяется их структурой сети.

Новая статья от Университета Капитала (Capital Normal University) и Университета Китайской академии наук (University of Chinese Academy of Sciences) представляет обзор важных достижений TN в направлении эффективного и интерпретируемого машинного обучения с использованием квантового подхода. “TN ML butterfly” перечисляет преимущества использования TN в ML. Преимущества TN в ML с квантовым уклоном могут быть суммированы в двух основных областях: интерпретируемость квантовых теорий и эффективность квантовых процедур. Вероятностная модель интерпретируемости, которая может превзойти описание классической информации или статистических подходов, может быть построена с использованием TN с квантовыми теориями, такими как теории запутывания и статистики.

С другой стороны, квантовые TN ML подходы смогут работать эффективно как на классических, так и на квантовых вычислительных платформах благодаря эффективным алгоритмам TN, основанным на квантовой механике, и значительно улучшенным технологиям квантовых вычислений. В частности, недавно достигнутые значительные успехи в области генеративных предварительно обученных трансформаторов привели к беспрецедентному вычислительному потенциалу и увеличению сложности моделей, что представляет как потенциал, так и вызовы для TN ML. В условиях нового искусственного интеллекта (AI) генеративных предварительно обученных трансформаторов способность интерпретировать результаты станет более важной, чем когда-либо ранее, позволяя проводить более эффективные исследования, более безопасный контроль и более эффективное использование.

Исследователи считают, что по мере наступления эпохи истинного квантового вычисления и настоящей эры NISQ TN быстро становится ведущим математическим инструментом для исследования квантового искусственного интеллекта с различных точек зрения, включая теории, модели, алгоритмы, программное обеспечение, аппаратные средства и приложения.

Публикация Researchers Study Tensor Networks for Interpretable and Efficient Quantum-Inspired Machine Learning появилась первоначально на MarkTechPost.