Clusterverfahren zur datenbasierten Generierung interpretierbarer Regeln unter Verwendung lokaler Entscheidungskriterien

Haendel, Lars

Autor(en):	Haendel, Lars
Titel:	Clusterverfahren zur datenbasierten Generierung interpretierbarer Regeln unter Verwendung lokaler Entscheidungskriterien
Sprache (ISO):	de
Zusammenfassung:	Betrachtet wird die Aufgabe der datenbasierten Modellierung von Prozessen für die Datenpunkte erhoben wurden. Jeder Datenpunkt besteht aus den Werten einer oder mehrerer Eingangsgrößen und einer dazugehörenden Ausgangsgröße. Das Modellierungsziel besteht darin, ausgehend von den Datenpunkten ein Modul zu lernen, das die Ausgangsgrößenwerte für zukünftige Datenpunkte, für die nur die Eingangsgrößenwerte bekannt sind, vorhersagt. Clusterverfahren können in diesem Kontext zur datenbasierten Regelgenerierung eingesetzt werden, indem jedes Cluster direkt als eine WENN-DANN Regel interpretiert wird. Dazu sind im Rahmen dieser Arbeit die zwei Clusterverfahren PNC2 und SMBC entwickelt worden. Der PNC 2-Algorithmus basiert auf dem Konzept der hierarchischen agglomerativen Clusterverfahren, bei denen - ausgehend von einer Partitionierung, in der jeder Datenpunkt ein eigenes Cluster darstellt - schrittweise, bis zum Erreichen eines Abbruchkriteriums, immer zwei einander anhand eines Ähnlichkeitskriteriums nahe liegende Cluster miteinander vereinigt werden. Die Grundidee ist es nun, eine Vereinigung nur dann zuzulassen, wenn das dann entstehende generalisierte Cluster einen Regeltest besteht.Der SMBC Algorithmus erweitert unüberwacht arbeitende modell-basierte Clusterverfahren in Richtung eines überwachten Generierens von Clustern. Cluster werden individuell nach Relevanzgesichtspunkten bewertet. Dies erhöht ihre Interpretierbarkeit. Durch Mechanismen zum Löschen, Hinzufügen und Vereinigen von Clustern wird automatisch eine passende Clusteranzahl ermittelt. Beim experimentellen Vergleich verschiedener Lernalgorithmen miteinander ist es notwendig, freie Parameter der jeweiligen Algorithmen systematisch einzustellen. Basierend auf einer Arbeit von Salzberg wird die sogenannte harte Validierung eingeführt, bei der alle freien Parameter mittels Kreuz-Validierung oder ähnlicher Ansätze innerhalb der jeweiligen Lernstichprobe eingestellt werden.
Schlagwörter:	Cluster Datenbasierte Modellierung Modellierung ROSA-Algorithmus PNC 2-Algorithmus Clusterverfahren SMBC-Algorithmus Regelbasiertes Lernverfahren
URI:	http://hdl.handle.net/2003/2834 http://dx.doi.org/10.17877/DE290R-5277
Erscheinungsdatum:	2003-08-13
Provinienz:	Universität Dortmund
Enthalten in den Sammlungen:	Lehrstuhl für Elektrische Steuerung und Regelung

Dateien zu dieser Ressource:

Datei	Beschreibung	Größe	Format
haendelunt.pdf	DNB	2.21 MB	Adobe PDF	Öffnen/Anzeigen

Diese Ressource ist urheberrechtlich geschützt.

Zur Langanzeige

Diese Ressource ist urheberrechtlich geschützt. rightsstatements.org