Познакомьтесь с Concept2Box Связующее звено между высокоуровневыми концепциями и детализированными сущностями в графах знаний – Двойной геометрический подход.

Concept2Box Знакомство с уникальной связью между идеями высокого уровня и детальной реализацией в графах знаний - Двухгеометрический подход

Много исследований было проведено с целью поиска способов представления больших наборов связанных данных, таких как графы знаний. Эти методы называют Кодированием графов знаний (КГЗ), и они помогают нам использовать эти данные для различных практических целей в реальном мире.

Традиционные методы часто не учитывают значительный аспект графов знаний, а именно присутствие двух различных типов информации: высокоуровневых концепций, относящихся к общей структуре (представление онтологии), и отдельных конкретных сущностей (представление экземпляра). Обычно эти методы рассматривают все узлы в графе знаний как векторы в одном скрытом пространстве.

Вышеуказанное изображение демонстрирует двухвидовый граф знаний, который включает (1) граф знаний представления онтологии, содержащий высокоуровневые концепции и мета-отношения, (2) граф знаний представления экземпляра, содержащий конкретные детальные экземпляры и отношения, и (3) коллекцию соединений (пеернаправленные ссылки) между этими двумя представлениями. Концепт2Бокс разработан для получения двойных геометрических вложений. В рамках этого подхода каждый концепт представлен как геометрическая коробка в скрытом пространстве, в то время как сущности представлены в виде точечных векторов.

В отличие от использования единственного геометрического представления, которое не может должным образом улавливать структурные различия между двумя перспективами в графе знаний и не имеет вероятностного значения относительно структуры концепций, авторы представляют Concept2Box. Этот инновационный подход одновременно встраивает оба представления графа знаний, используя двойные геометрические представления. Концепции представлены с использованием вложений в виде коробки, что позволяет изучать иерархические структуры и сложные отношения, такие как перекрытия и непересекаемость.

Объем этих коробок соответствует структуре концепций. В отличие от этого, сущности представлены в виде векторов. Чтобы скомпенсировать различия между вложениями коробки концепции и вложениями вектора сущности, авторы предлагают новую метрику расстояния между вектором и коробкой, а также обучают оба вложения совместно. Экспериментальные оценки, проведенные как на общедоступном графе знаний DBpedia, так и на новом созданном промышленном графе знаний, подчеркивают эффективность Concept2Box. Наша модель рассчитана на обработку различий в структуре информации в графах знаний. Однако в современных графах знаний, которые могут включать несколько языков, возникает еще одна проблема. Разные части графа знаний не только имеют различную структуру, но и используют разные языки, что делает его еще сложнее в понимании и работе. В будущем можно ожидать прогресса в этой области.