Познакомьтесь с ClimSim уникальным многомасштабным симулятором климата для слияния машинного обучения и физики в климатологических исследованиях

Познакомитесь с ClimSim уникальный многомасштабный симулятор климата, объединяющий машинное обучение и физику в климатологических исследованиях

Численные прогнозы физического моделирования являются основным источником информации, используемой для ориентации в политике по изменению климата. Несмотря на то, что они выталкивают пределы самых мощных суперкомпьютеров, текущим климатическим симуляторам необходимо моделировать физику облачности и сильных осадков. Сложность системы Земли серьезно ограничивает пространственное разрешение, которое исследовательская группа может использовать в этих симуляциях. “Параметризации” являются эмпирическими математическими представлениями физических процессов, происходящих на масштабах, меньших, чем у временного и географического разрешения климатических симуляций. К сожалению, предположения, используемые в этих параметризациях, часто приводят к ошибкам, которые могут ухудшить прогнозируемый климат в будущем.

Увлекательным способом моделирования сложных нелинейных физических процессов подсубрежимных масштабов, происходящих на масштабах, меньших, чем разрешение климатического симулятора, с меньшей сложностью компьютера является машинное обучение (ML). Захватывающим аспектом его применения является то, что оно приведет к более точным и менее затратным климатическим симуляциям, чем сейчас. Самый маленький разрешимый масштаб текущих климатических симуляций обычно составляет 80–200 км или размер среднего округа США. Однако для эффективного описания процесса образования облаков требуется разрешение 100 м или более, что требует значительного увеличения вычислительных мощностей.

Использование машинного обучения (ML) для преодоления ограничений классического вычисления по-прежнему является жизнеспособной опцией. Специалисты по машинному обучению объединяют эмуляторы ML макроскопических эффектов физических процессов маломасштабной физики с обычными численными методами решения уравнений, управляющих крупномасштабными движениями воздуха в атмосфере Земли. Эмуляторы учатся непосредственно на данных, полученных в ходе высокоразрешенных краткосрочных симуляций, а не полагаясь на эвристические предположения о маломасштабных процессах. В сущности, это проблема регрессии: при большомасштабных значениях входных данных эмулятор параметризации ML в климатической симуляции возвращает крупномасштабные выходные данные (такие как изменения ветра, влажности или температуры), возникающие из неразрешенной маломасштабной (подсубрезольной) физики.

Хотя недавно было разработано несколько доказательств концепции, гибридные климатические симуляции с использованием машинного обучения по-прежнему необходимо оперативно развертывать. Одна из основных преград, мешающих машинному обучению проявить интерес, – это получение достаточного количества данных для обучения. Все макроскопические факторы, контролирующие поведение подсубрезольной физики, должны быть включены в эти данные, чтобы они работали с последующими гибридными климатическими симуляциями ML. Было показано, что решение этой проблемы путем использования данных обучения из последовательных высокоразрешенных симуляций обходится дорого и может вызвать проблемы при их комбинировании с симуляцией климата. Использование многошкальных техник климатической симуляции для получения данных обучения является жизнеспособным подходом. Важно отметить, что они предлагают четкий интерфейс между планетарной динамикой хост-климатического симулятора и имитированной масштабной физикой высокого разрешения. Это теоретически делает возможным эффективное и доступное последовательное совмещение гибридных симуляций. В связи с отсутствием доступных наборов данных и требованием обладать экспертизой в выборе переменных, сложность кода операционной симуляции и недостаточность доступных наборов данных затруднили практическое применение многошкальных подходов.

Для использования в гибридных климатических симуляциях исследовательская группа, состоящая из ученых из более чем 20 знаменитых исследовательских учреждений, представляет ClimSim, самый большой и физически полный набор данных для обучения симуляторов машинного обучения воздушных бурь, облаков, турбулентности, осадков и радиации. ClimSim – это всеобъемлющий набор входных и выходных данных из многошкальных физических климатических симуляций. Чтобы снизить преграды для специалистов по машинному обучению в этой значимой проблеме, разработчики климатического симулятора и атмосферные ученые создали ClimSim. Их эталонный набор данных обеспечивает прочную основу для создания надежных структур, моделирующих параметризации физики облаков и сильных осадков и их взаимодействие с другими подсубрезольными явлениями. С помощью онлайн-сопряжения внутри грубого климатического симулятора эти структуры помогают климатическим симуляторам, используемым для долгосрочных прогнозов, работать более точно и лучше в целом.