Количественное измерение паттернов транспорта с использованием данных GTFS

Измерение количества транспортных паттернов с использованием данных GTFS

В этой статье я исследую общественный транспорт четырех выбранных гор, опираясь на общую спецификацию транзитного питания и различные инструменты пространственной науки данных.

Я выбрал четыре города для обзора их общественного транспорта с использованием доступных всем общей спецификации транзитного питания (GTFS) данных: Будапешт, Берлин, Стокгольм и Торонто. Это руководство посвящено введению в тему получения, обработки, агрегирования и визуализации данных общественного транспорта с использованием библиотек Pandas, GeoPandas и других стандартных инструментов науки о данных для выявления инсайтов о публичном транспорте. Понимание этих данных может быть полезным для различных сфер, таких как транспорт, градостроительство и локационный анализ.

Кроме того, несмотря на то, что формат GTFS считается общим и универсальным, я также выявлю ситуации, в которых требуются индивидуальные исследования и ручные проверки данных по каждому городу на всех этапах анализа.

1. Сбор и разбор данных GTFS

Для этой статьи я скачал данные общественного транспорта с веб-сайта Transitfeeds.com, агрегатора онлайн-данных общественного транспорта. В частности, я скачал данные с последними обновлениями для следующих городов:

В следующих блоках кода я буду неоднократно исследовать каждый из этих городов, создавать сравнительные графики и подчеркивать универсальность формата GTFS. Кроме того, чтобы облегчить обновление аналитики с новыми данными, я храню данные GTFS каждого города в папке с соответствующей датой обновления:

import osroot = 'data'cities = ['Будапешт', 'Торонто', 'Берлин', 'Стокгольм']updated = {city : [f for f in os.listdir(root + '/' + city) if '20' in f][0] for city in cities}updated

Результат выполнения этой ячейки:

Теперь давайте ближе рассмотрим различные файлы, хранящиеся в этих папках:

for city in cities…