Расшифровка сложных моделей искусственного интеллекта исследователи из Пердью превращают прогнозы глубокого обучения в топологические карты

Преобразование прогнозов глубокого обучения из сложных моделей искусственного интеллекта в топологические карты исследователи из Пердью расшифровывают процесс

Высокая параметризация сложных предикционных моделей затрудняет их описание и интерпретацию стратегий предсказаний. Исследователи предложили новый подход с использованием топологического анализа данных (TDA) для решения этой проблемы. Эти модели, включая машинное обучение, нейронные сети и AI-модели, стали стандартными инструментами в различных научных областях, но часто их сложно интерпретировать из-за обширной параметризации.

Исследователи из Purdue University признали необходимость инструмента, который мог бы преобразовать эти сложные модели в более понятный формат. Они использовали TDA для построения сетей Риба, предоставляющих топологическое представление, которое облегчает интерпретацию стратегий предсказания. Метод был применен в различных областях, показывая его масштабируемость на больших наборах данных.

Предлагаемые сети Риба в основном являются дискретизацией топологических структур, позволяющей визуализировать предсказательные ландшафты. Каждый узел в сети Риба представляет собой локальное упрощение пространства предсказания, вычисленное как кластер точек данных с похожими предсказаниями. Узлы соединяются на основе общих точек данных, раскрывая информативные взаимосвязи между предсказаниями и тренировочными данными.

Одно из значимых применений этого подхода – обнаружение ошибок в маркировке тренировочных данных. Сети Риба эффективно выявляют неоднозначные области или границы предсказаний, указывая на необходимость дальнейшего исследования потенциальных ошибок. Метод также продемонстрировал свою полезность для понимания обобщения в классификации изображений и осмотра предсказаний, связанных с патогенными мутациями гена BRCA1.

Были проведены сравнения с широко используемыми методами визуализации, такими как tSNE и UMAP, выявляющие возможность сетей Риба предоставлять больше информации о границах между предсказаниями и взаимосвязях между тренировочными данными и предсказаниями.

Построение сетей Риба требует наличия большого набора данных с неизвестными метками, известных связей между точками данных и вещественного руководства для каждого предсказанного значения. Исследователи применили рекурсивную процедуру разделения и объединения, называемую GTDA (графовый TDA), для построения сети Риба из исходных точек данных и графа. Метод масштабируем, как показано его анализом 1,3 миллиона изображений в ImageNet.

В практических приложениях рамки сетей Риба были применены к графовым нейронным сетям, предсказывающим типы товаров на Amazon на основе отзывов. Он выявил ключевые неоднозначности в категориях продуктов, подчеркивая ограничения точности предсказаний и указывая на необходимость улучшения меток. Аналогичные выводы были получены при применении рамок к предварительно обученной модели ResNet50 на наборе данных Imagenet, обеспечивая визуальную таксономию изображений и выявление ошибок в оценках истинной метки.

Исследователи также показали применение сетей Риба для понимания предсказаний, связанных с злокачественными мутациями генов, особенно в гене BRCA1. Сети выделили локализованные компоненты в последовательности ДНК и их сопоставление со вторичными структурами, упрощая интерпретацию.

В заключение исследователи ожидают, что топологические методы проверки, такие как сети Риба, будут играть важную роль в превращении сложных предикционных моделей в информативные понятные человеку выводы. Возможность метода выявлять проблемы от ошибок в маркировке до белковой структуры указывает на его широкое применение и потенциал как раннего диагностического инструмента для предикционных моделей.