Геопространственная наука о данных анализ шаблонов точек

Геопространственный анализ шаблонов точек в науке о данных

Быстрый учебник по анализу пространственных точечных данных в Python.

Фото от Bernard Hermant на Unsplash

Введение

Геопространственная наука о данных – это подобласть области данных, которая занимается анализом точечных данных с учетом места, где произошло событие.

Допустим, у нас есть сеть розничных магазинов, которые продает смартфоны. У нас есть несколько центров распределения и мы собираемся открыть несколько новых магазинов. Где мы можем это сделать?

Такие понимания могут быть получены с помощью геопространственного анализа, который покажет нам, где сосредоточены продажи, есть ли кластеры, где продажи выше или ниже, и другие идеи.

Анализ точечных паттернов вступает в игру, когда мы хотим убедиться, что рассматриваемый нами набор данных пространственно сгруппирован. Как и многое из нашей работы в качестве ученых-исследователей данных, точечный паттерн предполагает создание гипотезы и устранение большей части неопределенности для ее подтверждения или опровержения с использованием статистики, примененной к данным. В этом случае это не исключение. Существует несколько статистических тестов, которые должны быть выполнены, что будет показано в этой статье.

Кстати, мы недавно изучали геопространственную науку о данных здесь, на моем блоге. Если вы не знаете много о данной теме, вот две хорошие статьи, которые стоит прочитать перед тем, как приступить к этой статье.

Анализ геопространственных данных с помощью Python

Практическая статья по анализу данных с использованием Python кода.

towardsdatascience.com

Анализ геопространственных данных с помощью Python (Часть 2 – Тест гипотез)

Изучение геопространственного теста гипотез для объявлений Airbnb в Ашвилле.

towardsdatascience.com

Кодирование

Пакеты

Давайте начнем с пакетов, которые будут использоваться в этом упражнении. Если какой-либо из них не установлен в вашей среде, не забудьте использовать pip install или conda install (для пользователей Anaconda), а затем имя пакета.

import pandas as pd
import numpy as np
import geopandas as gpd
import seaborn as sns
...