Начало работы с запросами графовых баз данных с помощью шпаргалки!

Установка основ по работе с графовыми базами данных с помощью шпаргалки!

Графовые базы данных набирают обороты каждый год. Они никогда не полностью заменят реляционные базы данных, и не претендуют на это. Но они начнут занимать места, где страдают даталейки и хранилища данных. Графовая база данных быстрее и более интуитивно анализирует сети событий, ресурсов и людей:

  • Финансовые транзакции, связанные с сложными схемами и случайным мошенничеством
  • Взаимодействия в здравоохранении между пациентами, медицинским персоналом, учреждениями и оборудованием
  • Сети поставок от клиентов, поставщиков, подрядчиков и продуктов
  • Производственные структуры материалов с рецептами для входящих материалов

Такие типы взаимосвязи сетевых отношений сложно моделировать и визуализировать в реляционной или измеренной модели данных. Графовая база данных предоставляет структуру, имитирующую реальные бизнес-сети.

Когда вы начинаете работу с графовыми базами данных и языками запросов, важно готовиться к изменению своей мыслительной модели. Прежде всего, до сих пор нет широко принятого стандартного языка запросов, подобного SQL. Как вы можете видеть во вложении, есть группа конкурирующих языков и комитет, борющийся за достижение согласия по единому стандарту GQL. В наших целях сегодня мы будем использовать язык запросов Cypher, который разрабатывается и продвигается основным поставщиком баз данных – Neo4j.

В графовых запросах мы теряем некоторый синтаксис из SQL и приобретаем другой синтаксис. SELECT заменяется на MATCH. FROM и JOIN отбрасываются. Но команды WHERE и ORDER BY используются так же, как и раньше. Подсчетные функции, такие как SUM и AVG, все еще доступны, но GROUP BY отбрасывается. Но самое главное, мы получаем возможность запроса шаблонов в графе с использованием отношений узлов. На прикрепленном шпаргалке вы увидите список наиболее распространенных подходов к запросам.

Вот графическая модель, которая будет использоваться в прикрепленной шпаргалке.

Я выбрал граф аренды, потому что практически каждый в своей жизни арендовал что-то! Очевидно, что этот граф может быть гораздо сложнее, если добавить полный список свойств для каждого узла.

Следующий шаг – набраться немного опыта. Вы можете скачать образцовый набор данных из источника, такого как Kaggle, или у поставщика, такого как JanusGraph или Neo4j.

Если в вашей компании или хобби-проектах есть данные, связанные с сетевыми отношениями, попробуйте графовую базу данных. Вы обнаружите, что данные, которые неудобно размещать в реляционной базе данных, будут вполне подходящими для графа!

Скачайте шпаргалку сейчас!

****[Stan Pugsley](https://www.linkedin.com/in/spugsley/)**** является фрилансером по инженерии данных и консультантом по аналитике, проживающим в Солт-Лейк-Сити, Юта. Он также является лектором в Университете Юты, Школе бизнеса Экклз. С автором можно связаться по электронной почте.