Skip to content
CLICK TO ENTER

Machine-Learning für Boden und Schnee

Beispiel einer digital generierten Karte.

Anwendungen des maschinellen Lernens kommen bei zwei Projekten des Bundesforschungszentrums für Wald zum Einsatz. Der Fokus liegt auf der Schneedecke und dem Boden.

„Keine Ahnung?“ – das gibt es nicht mehr! Wenn wir etwas nicht wissen, dann fragen wir einfach eine Suchmaschine im Internet. Sie liefert uns in Sekunden die passende Antwort unter Verwendung ausgefeilter Algorithmen. Die Nachrichten berichten, dass künstliche Intelligenz im Vormarsch ist. Sie dominiert bei Strategiespielen wie Schach oder Go. Und Anwendungen aus allen Disziplinen werden aufgezählt, in denen sich künstliche Intelligenz ausbreitet. Können diese neuen Methoden auch in der Naturgefahrenforschung verwendet werden? Wie kann man die Begriffe verstehen? Was ist derzeit möglich und was ist noch zu erwarten?

Was Machine-Learning ist

Unter dem Begriff Machine-Learning werden Algorithmen zusammengefasst, die aus der Statistik kommen und mehr oder weniger komplexe Zusammenhänge aus großen Datensätzen erfassen können. Machine-Learning wird als Teilbereich der künstlichen Intelligenz bezeichnet, denn es werden bei beiden dieselben Algorithmen verwendet. Um von künstlicher Intelligenz sprechen zu können, ist es aber erforderlich, dass scheinbar intelligente Schlussfolgerungen vom Algorithmus gezogen werden. Das kann beispielsweise das autonome Autofahren sein, weil dabei ein Zusammenspiel aus Hören, Sehen, Entscheiden und Handeln nötig ist. Aber auch die Spracherkennung und die gezielte Aktion darauf deutet auf künstliche Intelligenz hin wie etwa bei der Übersetzung in andere Sprachen.

Einführung zu Machine-Learning in Naturwissenschaften

Beim Machine-Learning versuchen die Algorithmen Strukturen und Muster in großen Datensätzen zu finden. Das kann beispielsweise genutzt werden, um Datenausreißer zu identifizieren – seien es falsche Messwerte oder seltene (Extrem-)Werte. Diese Art der Anwendung von Machine-Learning wird Unsuperwised-Learning oder unüberwachtes Lernen genannt. Das Gegenstück dazu ist das Supervised-Learning oder überwachtes Lernen. Dabei werden Zielvariablen und Eingangsvariablen definiert. Mit Machine-Learning wird ein Modell gebildet, das die Eingangsdaten verwendet und die Zielvariablen berechnet. Aus einem vorher angefertigten Datensatz (Trainingsdatensatz) erlernt das Modell das Regelwerk. Angewendet auf neue Eingangsdaten werden die Werte für die Zielvariablen kalkuliert. Das überwachte Lernen funktioniert sowohl für klassifizierte Daten als auch für numerische Werte. Allerdings wird ein möglichst großer und fehlerfreier Datensatz zum Training vorausgesetzt.

Dringt man tiefer in die Fachliteratur ein, dann stößt man auf weitere Begriffe, wie Semi-Supervised Learning oder teilüberwachtes Lernen und Reinforcement-Learning (verstärktes Lernen). Sie weisen besondere Eigenschaften auf, wie es etwa beim Herausfinden aus einem Labyrinth erforderlich ist.

Lawinengefahr aus Schneeschichten

In den letzten Jahrzehnten haben sich physikalisch-basierte Modelle etabliert, die die Schichten einer Schneedecke berechnen. Die Schneeschichten werden durch Temperatur, Dichte, Kornformen, Korngrößen, Flüssigwasseranteil usw. charakterisiert. Das Ergebnis sind Zeitreihen dieser Eigenschaften und abgeleitete Kennzahlen zur mechanischen Stabilität der Schneedecke. Die Eingangsdaten für solche Schneemodelle sind Messwerte automatischer Wetterstationen. Um aus diesen Schnee-Zeit-Profilen konkrete Aussagen über die Lawinengefahr oder die Wahrscheinlichkeit für Lawinenabgänge treffen zu können, ist gemeinsam mit der ÖBB-Infrastruktur AG ein Modell entwickelt worden. Dabei wurden möglichst lange homogene Datensätze aus der Ereignisdokumentation der Ischgler Bergbahnen zusammengestellt, um die Machine-Learning Algorithmen zu trainieren  

In der Studie wurden alle Schneeschichten als Eingangsdaten verwendet und die Lawinenwarnstufen sowie die Lawinenauslösung mittels Sprengmittel oder Pistengerät als Zielvariable deklariert. Es wurden zwei voneinander unabhängige Machine-Learning-Algorithmen für diese Fragestellung adaptiert. Ein Artifical-Neural-Network oder künstliches neuronales Netz und eine Support-Vector-Machine. Da beide Verfahren unterschiedlich arbeiten, sind auch die Ergebnisse nicht gleich. Manche Situationen kann das eine Modell besser verarbeiten – und liefert genauere Ergebnisse – in anderen Fällen ist es umgekehrt. Auch dafür gibt es beim Machine-Learning Algorithmen. Denn ein nachgeschaltetes Modell wird trainiert, das erkennt, in welchen Fällen das eine oder andere Modell besser ist (engl. Ensemble-Learning).  Das Endergebnis ist daher besser als die Ergebnisse der einzelnen Modelle.

Schneedaten und meteorologische Daten werden von einem künstlichen neuronalen Netz und Support-Vektor-Machinen verarbeitet, um Aussagen über Lawinen zu berechnen. Eine Ensemble-Methodik nutzt diese als Zwischenergebnisse und ermittelt bessere Endergebnisse.
Abbbildung 1: Schneedaten und meteorologische Daten werden von einem künstlichen neuronalen Netz und Support-Vektor-Machinen verarbeitet, um Aussagen über Lawinen zu berechnen. Eine Ensemble-Methodik nutzt diese als Zwischenergebnisse und ermittelt bessere Endergebnisse.

Der entwickelte Modellkomplex kann auch auf Daten anderer Wetterstationen angewandt werden und so  Werte für die Lawinengefahr bzw. für die Wahrscheinlichkeiten, dass künstliche Auslösungen erfolgreich sein werden, liefern. Das ist ein Beispiel dafür, wie Wissen über eine Thematik aus einer bestimmten Region mit Machine-Learning erworben werden kann und dann auf andere Bereiche übertragen wird.  Genauere Informationen über diese Arbeit finden Sie in dem wissenschaftlichen Artikel (Link zum Paper).

Digitale Kartierung von Boden

Ähnlich einer Schneedecke ist auch der Boden in unterschiedliche Schichten mit unterscheidbaren Eigenschaften wie Korngrößenzusammensetzung, Lagerungsdichte, Porosität, pH-Wert, Kohlenstoffgehalt u.a. gegliedert. Im Gegensatz zum Schnee ist die zeitliche Dynamik von Änderungen um ein Vielfaches langsamer. Neben dem geologischen Ausgangssubstrat bestimmen die Art und Form der Landbedeckung, Landnutzung, das Relief und die klimatischen Rahmenbedingungen die Eigenschaften des Bodens. Großen Einfluss hat auch die Zeitdauer, die zur Bodenbildung zur Verfügung steht.

Im Projekt Dynamische Waldtypisierung Steiermark (FORSITE) stand man vor der Herausforderung, aus 1800 terrestrisch erhobenen und teilweise beprobten Bodenprofilen flächige Karten zu den physikalischen, chemischen und hydrologischen Eigenschaften des Untergrundes zu generieren. Dieser Prozess der digitalen Kartierung (engl. digital mapping) wurde über maschinelles Lernen, in diesem Falle einem künstlichen neuronalen Netz, bewerkstelligt. Als Grundlage der räumlichen Interpolation wurden zahlreiche Datensätze zu den klimatischen, topografischen und geologischen Gegebenheiten aufbereitet bzw. abgeleitet und dem Algorithmus als Vorhersagevariablen (engl. predictors) zur Verfügung gestellt. Bei der Berechnung wurde der Weg gewählt, dass eine Vielzahl an Zielvariablen gemeinsam berechnet wurden. Damit konnte vermieden werden, dass sich einzelne Zielvariablen gegenseitig widersprechen, da das neuronale Netz gleichzeitig auf alle Variablen angepasst (engl. fitting) wurde. Da über 100 Zielvariablen mit einer räumlichen Auflösung von 10 x 10 m berechnet wurden, stellte die optimale Nutzung und Leistungsfähigkeit der Rechner eine große Herausforderung dar.

Schema zur digitalen Kartierung mit einem künstlichen neuronalen Netz. Das Netz lernt an den Bodenprofilen die Zusammenhänge zwischen den vorhandenen flächenhaften Vorhersagekarten und den Zielvariablen
Abbildung 2: Schema zur digitalen Kartierung mit einem künstlichen neuronalen Netz. Das Netz lernt an den Bodenprofilen die Zusammenhänge zwischen den vorhandenen flächenhaften Vorhersagekarten und den Zielvariablen.

Punktuelle Erhebungen dienen als Basis der digitalen Kartierung.
Abbildung 3. Punktuelle Erhebungen dienen als Basis der digitalen Kartierung.

Ausblick und Kritik

Wohin führt die künstliche Intelligenz (KI) und warum steht KI in der Kritik?
Machine-Learning und künstliche Intelligenz sind auch in Wirtschaftsfragen, in der Medizin und der Technik allgegenwärtig. Es werden kurzfristige Schwankungen in den Aktienmärkten genutzt, um Investments zu tätigen; das erfolgt schneller, wie es ein Mensch machen könnte. Tomografien des Körpers werden analysiert und das mit einer Präzision, an die der Mensch nicht herankommt. Es gibt auch schon eine Publikation, die ausschließlich von einer künstlichen Intelligenz geschrieben wurde. Und kürzlich gewann ein Gemälde einen Preis, das von einer künstlichen Intelligenz gemalt wurde.
Grundsätzlich muss eine künstliche Intelligenz nicht immer recht haben. Der Algorithmus ist zwar so ausgelegt, dass er zumindest ein Optimum erreicht. Es bleibt aber ein Restrisiko, dass es eine bessere Lösung für die Fragestellung gibt. Weiters können sich Menschen entmündigt fühlen, wenn sie selbst die Entscheidung nicht mehr nachvollziehen können, da das menschliche Gehirn im Gegensatz zu mathematischen Verfahren nur sehr wenige Dimensionen begreifen kann.

Welche Produkte können wir für Naturgefahren erwarten?
Die beiden oben genannten Anwendungen zeigen einen Einstieg in die Thematik. Überall dort, wo enorme Datenmengen anfallen, wird Machine-Learning verstärkt zum Einsatz kommen. Fernerkundungsmethoden sind solche Datenquellen. Sie sind auch deshalb für Naturgefahren interessant, weil Prozesszonen meist eine Gefahr für Personen und technische Anlagen darstellen. Großflächige terrestrische Kartierungen sind auf Grund der notwendigen zeitlichen und personellen Ressourcen kaum mehr vorstellbar. Hier werden Verfahren des Digital-Mappings zunehmend an Bedeutung gewinnen. Die entwickelten Verfahren sind dabei auf unterschiedliche Variablen der Geo-, Pedo- und Hydrosphäre anwendbar, sofern die geeigneten Prädiktoren bereitgestellt werden können.

Links

Link zum Paper

Auszeichnung für das Projekt Forsite

https://infrastruktur.oebb.at

https://www.agrar.steiermark.at/cms/ziel/151504582/DE

Dynamische Waldtypisierung Steiermark – Open Government Data, Land Steiermark

ÖBB Infra Logo

Logoleiste BM, Ländliche Entwicklung, Steiermark, EU