Пространственная инженерия данных с использованием Typescript

Пространственная инженерия данных на Typescript

Фото от T K на Unsplash

Установка конвейеров данных в направлении автоматизированной пространственной науки о данных

Введение

Мы можем представить данные как воду, а компании как города. Так же, как город растет с ростом населения и нуждается в большем количестве воды для обслуживания жителей, компания, по мере своего развития, требует готовых к потреблению данных для поддержки своей деятельности. Таким компаниям требуется система конвейеров данных, которая действует подобно трубам и инфраструктуре, поставляющим воду в дома города. В нашей аналогии данных, инженеры данных – это люди, которые строят и поддерживают эти конвейеры данных. Для обычных массивов или таблиц данных это довольно просто, однако сложнее дело обстоит с пространственными данными.

Пространственные данные немного отличаются от обычных данных; они содержат пространственные атрибуты. Эти атрибуты позволяют нам установить пространственные отношения; также известные как геопространственная топология. Даже если у двух таблиц нет первичных и внешних ключей, мы все равно можем их объединить, если у них есть пространственные атрибуты. Если мы визуализируем пространственный атрибут, у нас есть карта!

Пространственная наука о данных: пространственное объединение SQL

объединение таблиц, если у них есть пространственные отношения. Бонус: я делаю это в Ms. Excel

towardsdatascience.com

Построение конвейеров пространственных данных отличается от создания обычных конвейеров данных. В этом случае мы в основном обрабатываем пространственные атрибуты данных с помощью пространственного SQL, что является менее распространенным навыком в сообществе ученых-исследователей данных. После построения конвейера данных аналитики могут приступить к анализу пространственных данных из конвейера данных. Это означает, что аналитик данных может сосредоточиться на создании пространственных инсайтов, не беспокоясь о доступности данных. Это также означает, что карты могут быть автоматически сгенерированы с последними пространственными данными.

Эта статья

В этой статье рассматривается, как построить конвейеры пространственных данных с использованием TypeScript и NodeJS. Мы можем назвать это процессом ETL (Извлечение, Преобразование, Загрузка), но с пространственными данными. Сначала мы рассмотрим, как мы можем получить данные из источника с использованием TypeScript (Извлечение). Затем мы преобразуем эти данные в правильную структуру для хранения…