О визуализации диапазонов данных с помощью Matplotlib.

Визуализация диапазонов данных с помощью Matplotlib раскрываем все тонкости

Сравнение прогнозов ураганов NOAA

Ураган из космоса от модели Leonardo AI DreamShaper_v7

Построение дискретных данных просто; представление диапазонов данных более сложно. К счастью, в библиотеке matplotlib для Python есть встроенная функция fill_between(), которая позволяет легко визуализировать диапазоны данных. В этом проекте Quick Success Data Science мы будем использовать ее для сравнения ежегодного прогноза ураганов Национального океанического и атмосферного управления (NOAA).

Набор данных

Каждый май NOAA публикует свой доклад “Атлантический прогноз ураганов” на период с июня по ноябрь. Эти прогнозы включают предсказанные диапазоны для именованных штормов, ураганов и сильных ураганов (определенных как категории 3 и выше). Пример отчета на 2021 год вы можете найти здесь [1]. Данные NOAA/Службы национальной погоды предоставляются правительством США в качестве открытых данных, которые можно использовать бесплатно для любых целей.

Чтобы оценить достоверность этих прогнозов, мы будем использовать ежегодные сводки ураганов, предоставленные Википедией. Эти сводки содержат фактическое количество штормов и ураганов для каждого года. Сводку сезона 2021 года вы можете найти здесь [2]. Страницы Википедии предоставляются под лицензией CC BY-SA 4.0.

Википедия также содержит списки событий Ла-Нинья и Эль-Ниньо [3][4]. Это представляет собой погодные условия, которые возникают в Тихом океане каждые несколько лет. В годы Ла-Нинья вода в восточной части Тихого океана холоднее обычного, что охлаждает воздух над ней. В Эль-Ниньо происходит обратное.

Погодные условия Ла-Нинья способствуют более сильной активности ураганов в Атлантическом бассейне, в то время как Эль-Ниньо подавляет развитие ураганов [5]. Для проверки этого мы также будем использовать цветовую кодировку в нашей графике для этих событий.

Для удобства я уже собрал всю эту информацию за период с 2001 по 2022 год и сохранил ее в CSV-файле в этом Gist.

NOAA выпускает обновленные прогнозы ураганов каждый август, поэтому при выборе данных и ссылках на прогнозы нужно быть осторожным. Мы будем использовать майские прогнозы.

Установка библиотек

Мы будем использовать pandas для обработки данных и matplotlib для построения графиков. Установите их с помощью:

conda install matplotlib pandas