MarDATA - Machine learning in climate modelling

MarData Logo

Bearbeiterin: Sonal Rami
Projektförderung: Helmholtz Gesellschaft
Partner: Thomas Jung, Alfred Wegener Institut, Bremerhaven
Laufzeit: 01.12.2019 - 30.11.2022

Computersimulationen können die volle Dynamik der realen Welt nicht vollständig auflösen - es wird immer eine räumliche und zeitliche Diskretisierung notwendig sein, die eine Parametrisierung der Skalen erfordert, die kleiner als die Diskretisierungsskala sind. Diese Parametrisierungen werden in der Regel aus einer begrenzten Anzahl von Beobachtungen gewonnen, die nicht notwendigerweise repräsentativ für den gesamten Globus sind, und oft stark abgestimmt, um eine endgültige Lösung zu erhalten, die nahe am beobachteten mittleren Zustand des Klimasystems liegt. Methoden des maschinellen Lernens (ML) ermöglichen die Entwicklung von Parametrisierungen, die klassische Methoden übertreffen können und viel robustere Lösungen liefern (z. B. Reichstein et al, 2019 und Referenzen darin). In diesem Zusammenhang besteht eine der größten Herausforderungen - die sowohl den marinen (Physik) als auch den Informatikbereich betrifft - darin, diese Parametrisierungen durch physikalische Gesetze einzuschränken, so dass die wichtigsten Erhaltungsprinzipien nicht verletzt werden. Darüber hinaus haben Meereis-Ozean-Modelle wie FESOM bestimmte Engpässe in hochauflösenden Konfigurationen, die die Skalierbarkeit und damit die effektive Nutzung von Exascale-Supercomputern der nächsten Generation ernsthaft behindern. In diesem Zusammenhang wurde vorgeschlagen, rechenintensive Teile durch Ansätze des maschinellen Lernens zu ersetzen, um Modelle exascale-tauglich zu machen.

In diesem Projekt sollen zwei Haupthypothesen getestet werden: (1) Maschinelles Lernen wird zu wesentlich besseren Parametrisierungen in Klimamodellen führen und (2) Methoden des maschinellen Lernens können helfen, Rechenengpässe bei hochauflösenden Modellläufen auf extremen Hochleistungsrechnern zu überwinden. Zum einen ist geplant, neue Parametrisierungen zur Darstellung von Ozeanwirbeln in dem am AWI entwickelten Finite Volume Sea Ice-Ocean Model (FESOM2) zu entwickeln. Zu diesem Zweck werden Modelle, die Wirbel explizit in ultrahoher Auflösung auflösen, als Beispiele für das Training des ML-Modells verwendet. Darüber hinaus soll auch Beobachtungswissen mit einbezogen werden. Zweitens ist geplant, einen Schritt weiter zu gehen, indem ML-Methoden eingesetzt werden, um bestimmte Teile von Erdsystemmodellen zu ersetzen, die bei hochauflösenden Konfigurationen Rechenengpässe darstellen. Ein guter Kandidat ist in diesem Zusammenhang das Meereismodell. Als erster Schritt ist geplant, das ML-Modell auf der gleichen oder einer hochauflösenden Version des gleichen Meereismodells zu trainieren, das als "wahre" Lösung genommen wird. Weiterhin ist geplant, zu untersuchen, wie Satellitenbeobachtungen in das ML-Modell integriert werden können. Generell erfordert die Integration zusätzlicher domänenspezifischer Informationen, die als Daten (z.B. Satellitendaten) oder physikalische Modelle (z.B. zur Beschreibung der grundlegenden physikalischen Gesetze der Eisbildung) vorliegen, spezifische Netzstrukturen und angepasste Trainingsverfahren. Hier zielen wir insbesondere darauf ab, sehr hoch aufgelöste Modelle zu erhalten, bei denen das zugrunde liegende mathematische Modell zu einem schlecht gestellten inversen Problem führt. Dies erfordert die Anpassung von regularisierten Deep-Learning-Ansätzen, die auf generativen adversarischen Netzwerkarchitekturen basieren (Arridge et al. 2019).

Zielsetzungen in diesem Projekt sind: (1) Verbesserung der Realitätsnähe von Klimamodellen und damit ihrer Fähigkeit, zukünftige Klimaveränderungen zu projizieren, (2) Entwicklung von Parametrisierungen von Prozessen auf der Untergitter-Skala basierend auf ML-Methoden für FESOM2 und (3) Überwindung von Rechenengpässen in FESOM2 durch Ersetzen eines Teils des Codes durch ML-Approximationen.

Mehr Informationen unter: https://www.mardata.de/