Authors: Tschiersch, Lars
Title: Strategie zur Lösung von Erosionsproblemen unter Verwendung von Luft- und Bodendaten
Language (ISO): de
Abstract: Erosion ist ein zentrales Problem für die Menschen. Nicht nur in südlichen Ländern, sondern auch bei uns in Mitteleuropa weitet sich die Erosion aus. Mit dieser Arbeit soll ein Beitrag dazu geleistet werden, die Erosionsausbreitung besser zu verstehen und zukünftig diese be-grenzen zu können. Im Rahmen einer SFB-Studie über 'Adapted farming' (SFB 308) wurde in der Zeit zwischen 1992 und 1994 in Sadoré, Niger, die Bodenveränderung durch Windero-sion gemessen. Die dort gesammelten Daten und die getätigten Luftaufnahmen sind die Grundlage für diese Arbeit. Wie in vielen Erosionsstudien ist die Datenqualität und -quantität im statistischen Sinne als nicht gut zu bewerten. Von daher soll anhand von simulierten Daten die Lösungsstrategie verdeutlicht werden.Die Clusterungsalgorithmen sind so konzipiert, daß sie die Bildpunkte eines im RGB-Farb-format vorliegenden Bildes clustern. Als Clusterung bezeichnet man die Einteilung einer Menge von Werten in homogene Klassen (Cluster). Die Clusterungen werden zu einem mit dem Maximum-Linkage-Algorithmus vorgenommen sowie mit der Neuentwicklung des er-weiterten Maximum Linkages. Diese beiden Verfahren werden mit neuronalen Netzen ver-glichen, die bei Clusterung ebenfalls häufig zum Einsatz kommen. Mit dem Maximum-Linkage-Algorithmus werden einzelne Farbwerte des Luftbildes aus der Menge aller Farb-werte (des Bildes) ausgewählt. Diese gewonnenen Farbwerte werden als Zentroide bezeich-net. Dabei sind die Zentroide so konzipiert, daß der euklidische Abstand zwischen ihnen möglichst groß ist. Zu diesen Zentroiden werden die verbliebenen Farbwerte klassifiziert. Das Maximum-Linkage-Verfahren zeichnet sich durch seine hohe Trennschärfe zwischen den Clustern aus. Zudem ist die Rechenzeit im Vergleich zu herkömmlichen Clusteralgorithmen die auf dem k-Mittelwert-Verfahren beruhen deutlich reduziert. Das erweiterte Maximum Linkage berücksichtigt zudem noch die Häufigkeitsverteilung der Farbwerte. Mittels eines vom Anwender zu spezifizierenden Parameters kann die Häufigkeit mehr oder weniger stark einfließen. Die Berücksichtigung der Häufigkeit dient dazu, die Farben die oft vorkommen auch ein größeres Gewicht im Bezug auf die Zentroidberechnung zu verleihen. Gleichzeitig werden aber die in der Erosionsforschung wichtigen seltenen Elemente nicht außer Acht ge-lassen. So kann beispielsweise eine Mauer in der Wüste oder aber ein großer Ast die Aus-breitung der Erosion deutlich verlangsamen. Diese seltenen Elemente werden von der her-kömmlichen Verfahren (k-Mittelwert-Verfahren) zu großen Clustern klassifiziert, so daß sie für eine spätere Interpretation nicht mehr zur Verfügung stehen. Da diese neuen Algorithmen von keinem bekannten Programm unterstützt werden, ist ein Computerprogramm entwickelt worden. Das als Picana bezeichnete Programm vereint nicht nur die Maximum-Linkage-Algo-rithmen, sondern auch neuronale Netze. Ein neuronales Netz besteht aus verschiedenen Schichten die jeweils eine vorgegebene Anzahl an Elementen (Neuronen) enthält. Diese Neu-ronen sind miteinander verbunden. Die Verbindung zwischen den Neuronen wird über ver-änderbare Gewichte gesteuert. In einer sogenannten Lernphase werden die Gewichte in Ab-hängigkeit von der Netzeingabe verändert. Dabei wird die Netzstruktur an die Daten ange-paßt. Man spricht in diesem Zusammenhang von Lernen. Die Gewichte der Netzes dienen nach Abschluß der Lernphase als Zentroide. Die in Picana implementierten Netze sind aus-schließlich neuronale Netze die unüberwacht lernen. Insbesondere sind da die selbstorganisie-renden Karten nach Teuvo Kohonen zu nennen. Neben den klassischen Varianten dieser Netze, sind zudem selbstangepaßte neuronale Netze implementiert worden, die die Laufzeit im Bezug auf die Standardumsetzung deutlich reduzieren. Dazu wurden spezielle Lernraten und Nachbarschaftsfunktionen verwendet worden. Die Clusterungen die mit neuronalen Netzen gewonnen werden, haben allerdings eine nicht ganz so gute Trennschärfe zwischen den Clustern wie die Linkage-Verfahren. Sind die verschiedenen Clusterungen berechnet worden, muß die Güte bestimmt werden. Wie erwähnt sind die Cluster so gebildet, daß sie möglichst homogen sind. Die Homogenität kann mit einem Kriterium überprüft werden. Hier bietet sich die Intra-Class-Varianz an. Ein kleiner Wert für die Intra-Class-Varianz deutet auf einen gute Clusterung im Sinne des Kriteriums hin. Für den vorliegenden Kontext der Erosionsuntersuchung ist dieses Kriterium nicht hin-reichend. Hier werden viel mehr Cluster benötigt, die sich deutlich voneinander trennen lassen. Dazu werden zwei weitere Kriterien vorgestellt, die die Trennschärfe zwischen den Clustern beurteilen. Diese Kriterien sind das neu entwickelte Kriterium der mittleren Mini-maldistanz sowie eine gewichtete Variante davon.Zu den Clusterungen der Luftbilder kommt die Auswertung von bodenkundlichen Beobach-tungen. Die Messungen der Bodenveränderung werden in einem Zustandsraummodell modelliert. Dazu wurden die Daten mittels des bekannten statistsichen Programmpaktes SAS ausgewertet. In dieses Modell sollen auch die Ergebnisse der Clusterung mit einfließen, um das Modell zu verbessern. Die schlußendlliche Zusammenführung steht dabei noch aus. Die hier vorgestellten Ergebnisse der Modellierung sollen vielmehr nur den Weg aufzeigen, wie eine Kombination von Luft- und Bodendaten vorgenommen werden kann.Das erwähnte Programm Picana ist ein wesentlicher Bestandteil der Arbeit. Das in C++ und Java verfaßte Programm wird bereits anderweitig im Rahmen von Erossionsuntersuchungen benutzt. Neben dem Remote Sensing Laboratory des Institut des Regions Arides, Medenine/Tunesien, wird es vor allem vom Fachbereich für Landwirtschaft, internationale Agrarentwicklung und ökologische Umweltsicherung an der Universität Gesamthochschule Kassel eingesetzt. Dort wird anhand dieses Programms bisher schwer interpretierbares Bild-material untersucht. Einige Vorschläge zur Verbesserung sind bereits in die aktuelle Version des Programms eingeflossen. Bei einer gerade begonnen Studie in China werden die Daten jetzt speziell für die verwendeten Clusterverfahren erhoben. Im Zuge dessen, soll die Studie auch so angelegt werden, daß die Datenqualität sich grundlegend verbessert.Im Rahmen dieser Arbeit sind zwei Diplomarbeitsthemen entstanden. Eine Arbeit am Fachbe-reich Statistik beschäftigt sich mit dem Einfluß der Gewichtungsparameters beim erweiterten Maximum-Linkage-Verfahren. Die andere Arbeit am Fachbereich Informatik setzt sich mit der weiteren Verbesserung der Implementierung der Algorithmen auseinander. Es soll unter-sucht werden, ob und wie sich die Laufzeit erneut reduzieren läßt und ob ggf. eine Paral-lelisierung des Maximum-Linkage-Algorithmus möglich ist.
Subject Headings: Clusterverfahren
Neuronale Netze
Maximum Linkage
Zeitreihen
URI: http://hdl.handle.net/2003/2780
http://dx.doi.org/10.17877/DE290R-14911
Issue Date: 2002-08-12
Provenance: Universität Dortmund
Appears in Collections:Institut für Wirtschafts- und Sozialstatistik

Files in This Item:
File Description SizeFormat 
Tschiersch.pdfDNB2.26 MBAdobe PDFView/Open
Tschiersch.ps7.16 MBPostscriptView/Open


This item is protected by original copyright



This item is protected by original copyright rightsstatements.org