Google AI представляет WeatherBench 2 фреймворк машинного обучения для оценки и сравнения различных моделей прогнозирования погоды

Google AI представляет WeatherBench 2, фреймворк для сравнения моделей прогнозирования погоды.

Машинное обучение (ML) в последние годы все чаще используется в прогнозировании погоды. Теперь, когда модели ML могут конкурировать с физическими моделями на основе операционной физики по точности, есть надежда, что эти успехи вскоре позволят улучшить точность погодных прогнозов по всему миру. Открытые и воспроизводимые оценки новых методов с использованием объективных и установленных метрик являются важными для достижения этой цели.

Последние исследования Google, Deepmind и Европейского центра по прогнозированию погоды VoAGI-Range представляют WeatherBench 2 – систему для оценки и сравнения моделей прогнозирования погоды. Помимо тщательной реплики набора данных ERA5, используемого для обучения большинства моделей ML, WeatherBench 2 содержит код для оценки с открытым исходным кодом и общедоступные наборы данных с оптимизацией для работы в облаке.

В настоящее время WeatherBench 2 оптимизирована для глобального прогнозирования на основе VoAGI-Range (1-15 дней). Исследователи планируют рассмотреть возможность включения оценки и базовых значений для других задач, таких как непрерывное прогнозирование (nowcasting) и краткосрочный (0-24 часа) и долгосрочный (15+ дней) прогнозы, в ближайшем будущем.

Оценить точность прогнозов погоды сложно с помощью простого показателя. Средняя температура может быть важнее для одного пользователя, чем частота и сила порывов ветра. Поэтому WeatherBench 2 включает множество мер. Несколько важных критериев, или “ключевых” метрик, были определены для краткого обзора исследования в соответствии с общепринятой оценкой, проводимой метеорологическими агентствами и Всемирной метеорологической организацией.

WeatherBench 2.0 (WB2) является эталоном для прогнозирования погоды на основе данных. Она вдохновлена новыми техниками искусственного интеллекта, которые появились с момента выпуска первого WeatherBench. WB2 создана так, чтобы как можно ближе имитировать операционную оценку прогноза, используемую многими центрами погоды. Она также предоставляет прочную основу для сравнения экспериментальных методов с этими операционными стандартами.

Цель заключается в облегчении эффективных операций машинного обучения и обеспечении воспроизводимости результатов путем публичного предоставления кодов оценки и данных. Исследователи считают, что WB2 может быть расширена с добавлением дополнительных метрик и базовых значений в соответствии с требованиями сообщества. В статье уже намекнуто на несколько потенциальных расширений, включая более детальное изучение экстремальных показателей и переменных влияния на мелких масштабах, возможно, через станционные наблюдения.