Исследователи Microsoft предлагают нейронные графические модели (NGM) новый тип вероятностных графических моделей (PGM), который изучает представление функции вероятности на области с использованием глубокой нейронной сети.

Исследователи Microsoft предлагают новый тип вероятностных графических моделей (PGM) - нейронные графические модели (NGM), которые используют глубокую нейронную сеть для представления функции вероятности на области.

В области рассуждения при неопределенности вероятностные графические модели (PGM) давно являются важным инструментом для анализа данных. Эти модели предоставляют структурированную основу для представления отношений между различными признаками в наборе данных и могут изучать подлежащие вероятностные распределения, которые отражают функциональные зависимости между этими признаками. Независимо от того, изучение данных, выполнение логических выводов или генерация выборок, графические модели предлагают ценные возможности для исследования сложных областей. Однако они также имеют ограничения, часто ограниченные типами переменных и сложностью операций, вовлеченных в них.

Традиционные PGM доказали свою эффективность в различных областях, но они гибкие. Многие графические модели предназначены для работы исключительно с непрерывными или категориальными переменными, что ограничивает их применимость к данным различных типов. Более того, конкретные ограничения, такие как запрет наличия непрерывных переменных в качестве родительских для категориальных переменных в направленных ациклических графах (DAG), могут ограничивать их гибкость. Кроме того, традиционные графические модели могут быть ограничены в типах вероятностных распределений, которые они могут представлять, часто предпочитая многомерные гауссовские распределения.

Исследователи из Microsoft предлагают революционное решение этих проблем в своей недавней статье “Нейронные графические модели”, представленной на 17-й Европейской конференции по символическим и количественным подходам к рассуждению с неопределенностью (ECSQARU 2023). Они представляют Нейронные графические модели (NGM), новый тип PGM, который использует глубокие нейронные сети для изучения и эффективного представления функций вероятности над областью. Отличительной особенностью NGM является их способность преодолевать ограничения, обычно связанные с традиционными PGM.

NGM предлагают универсальную основу для моделирования вероятностных распределений без наложения ограничений на типы переменных или распределений. Это означает, что они могут обрабатывать различные типы входных данных, включая категориальные, непрерывные, изображения и вложения. Более того, NGM предоставляют эффективные решения для логического вывода и генерации выборок, что делает их мощным инструментом для вероятностного моделирования.

Основная идея NGM заключается в использовании глубоких нейронных сетей для параметризации функций вероятности над заданной областью. Эта нейронная сеть может быть эффективно обучена путем оптимизации функции потерь, которая одновременно обеспечивает соблюдение указанной зависимости (предоставленной в виде входного графа, как направленного, так и ненаправленного) и соответствие данным. В отличие от традиционных PGM, NGM не ограничены общими ограничениями и могут без проблем обрабатывать разнообразные типы данных.

Чтобы глубже погрузиться в NGM, давайте рассмотрим их производительность на основе экспериментальной проверки на реальных и синтетических наборах данных:

  1. Данные о смертности младенцев: Исследователи использовали данные из Центров по контролю и профилактике заболеваний (CDC), сосредоточившись на переменных беременности и рождения для живорожденных в США. В наборе данных также содержалась информация о смертности младенцев. Предсказание смертности младенцев является сложной задачей из-за редкости таких событий. Тем не менее, NGM продемонстрировали впечатляющую точность логического вывода по сравнению с другими методами. Они превзошли логистическую регрессию и байесовские сети и показали сравнимую производительность с Explainable Boosting Machines (EBM) для категориальных и порядковых переменных.
  2. Синтетические данные гауссовских графических моделей: Помимо реальных данных, исследователи оценили NGM на синтетических данных, сгенерированных из гауссовских графических моделей. NGM продемонстрировали свою способность адаптироваться к сложным структурам данных и хорошо работать в такой синтетической среде.
  3. Данные о раке легких: Для дополнительной проверки NGM был использован другой набор данных, полученный из Kaggle и связанный с раком легких. Хотя конкретные результаты на этом наборе данных не обсуждались подробно, это демонстрирует применимость NGM в различных областях.

Одной замечательной особенностью NGM является их способность справляться с ситуациями, в которых традиционные модели испытывают трудности, особенно в прогнозировании низкопробабильных событий. Например, NGM превосходят в прогнозировании причины смерти младенцев, даже когда это редкое явление. Это подчеркивает устойчивость NGM и потенциал в областях, где точность в отношении редких результатов является критической.

В заключение, нейронные графические модели (NGM) значительно продвигают вероятностное графическое моделирование. Сочетая гибкость и выразительность глубоких нейронных сетей с структурными преимуществами графических моделей, NGM предлагают мощное и универсальное решение. Они освобождаются от ограничений, налагаемых традиционными PGM, позволяя специалистам работать с более широким спектром типов данных и распределений. С их доказанной способностью обрабатывать сложные зависимости и точно прогнозировать редкие события, NGM обладают большим потенциалом для решения реальных задач в различных областях. Исследователям и специалистам по обработке данных рекомендуется изучить возможности NGM и использовать их потенциал для улучшения усилий в вероятностном моделировании.