Authors: Haendel, Lars
Title: Clusterverfahren zur datenbasierten Generierung interpretierbarer Regeln unter Verwendung lokaler Entscheidungskriterien
Language (ISO): de
Abstract: Betrachtet wird die Aufgabe der datenbasierten Modellierung von Prozessen für die Datenpunkte erhoben wurden. Jeder Datenpunkt besteht aus den Werten einer oder mehrerer Eingangsgrößen und einer dazugehörenden Ausgangsgröße. Das Modellierungsziel besteht darin, ausgehend von den Datenpunkten ein Modul zu lernen, das die Ausgangsgrößenwerte für zukünftige Datenpunkte, für die nur die Eingangsgrößenwerte bekannt sind, vorhersagt. Clusterverfahren können in diesem Kontext zur datenbasierten Regelgenerierung eingesetzt werden, indem jedes Cluster direkt als eine WENN-DANN Regel interpretiert wird. Dazu sind im Rahmen dieser Arbeit die zwei Clusterverfahren PNC2 und SMBC entwickelt worden. Der PNC 2-Algorithmus basiert auf dem Konzept der hierarchischen agglomerativen Clusterverfahren, bei denen - ausgehend von einer Partitionierung, in der jeder Datenpunkt ein eigenes Cluster darstellt - schrittweise, bis zum Erreichen eines Abbruchkriteriums, immer zwei einander anhand eines Ähnlichkeitskriteriums nahe liegende Cluster miteinander vereinigt werden. Die Grundidee ist es nun, eine Vereinigung nur dann zuzulassen, wenn das dann entstehende generalisierte Cluster einen Regeltest besteht.Der SMBC Algorithmus erweitert unüberwacht arbeitende modell-basierte Clusterverfahren in Richtung eines überwachten Generierens von Clustern. Cluster werden individuell nach Relevanzgesichtspunkten bewertet. Dies erhöht ihre Interpretierbarkeit. Durch Mechanismen zum Löschen, Hinzufügen und Vereinigen von Clustern wird automatisch eine passende Clusteranzahl ermittelt. Beim experimentellen Vergleich verschiedener Lernalgorithmen miteinander ist es notwendig, freie Parameter der jeweiligen Algorithmen systematisch einzustellen. Basierend auf einer Arbeit von Salzberg wird die sogenannte harte Validierung eingeführt, bei der alle freien Parameter mittels Kreuz-Validierung oder ähnlicher Ansätze innerhalb der jeweiligen Lernstichprobe eingestellt werden.
Subject Headings: Cluster
Datenbasierte Modellierung
Modellierung
ROSA-Algorithmus
PNC 2-Algorithmus
Clusterverfahren
SMBC-Algorithmus
Regelbasiertes Lernverfahren
URI: http://hdl.handle.net/2003/2834
http://dx.doi.org/10.17877/DE290R-5277
Issue Date: 2003-08-13
Publisher: Universität Dortmund
Appears in Collections:Lehrstuhl für Elektrische Steuerung und Regelung

Files in This Item:
File Description SizeFormat 
haendelunt.pdfDNB2.21 MBAdobe PDFView/Open


This item is protected by original copyright



All resources in the repository are protected by copyright.