Authors: Garczarek, Ursula
Title: Classification rules in standardized partition spaces
Other Titles: Klassifikationsregeln in standardisierten Partitionsräumen
Language (ISO): en
Abstract: In dieser Doktorarbeit werden so genannte standardisierte Partitionsräume eingeführt, um Klassifikationsregeln darzustellen. Diese bieten ein übergreifendes Bezugssystemzur Darstellung einer Vielzahl unterschiedlicher Klassifikationsregeln.Der ursprüngliche Verwendungszweck von Klassifikationsregeln ist die Zuweisung von Objekten in genau eine von mehreren fest vorgegebenen Klassen auf Grund der Beobachtung bestimmter Prädiktorwerte an den Objekten. Standardisierte Partitionsräume können genutzt werden, wann immer man Klassifikationsregeln über dieses primäre Ziel hinaus einsetzen möchte.So möchte man zum Beispiel in vielen Klassifikationsproblemen das Verständnis über den Zusammenhang von Prädiktoren und Klassenzugehörigkeit vertiefen. Eine gängige Methode dafür beruht auf der Betrachtung der von Klassifikationregeln ableitbaren Partitionsräume an Hand der Entscheidungsgrenzen im Prädiktorraum. Ein Vergleich der Partitionen verschiedener Verfahren für das gleiche Problem wird vorgenommen, um verfahrensinvariant bestätigte Zusammenhänge zu finden.Im allgemeinen wird mit solchen Vergleichen dargestellt, welche unterschiedlichen Beziehungen Verfahren überhaupt modellieren können. In hochdimensionalen Räumen, und für Klassifikationsregeln, die mit sehr unterschiedlichen Verfahren generiert wurden, können Vergleiche von Partitionen unverständlich werden.In diesen Fällen schlagen wir vor, nicht den Prädiktorraum als gleich bleibende Größe im Vergleich einzusetzen, sonderndie Entscheidungsgrenzen und -gebiete zu standardisieren. Klassifikationregeln werden dann im Hinblick auf die verschiedenen Muster verglichen, die sie bei der Platzierung von Objekten eines Testdatensatzes in diesen standardisieren Gebieten erzeugen.So kann man mit allen Klassifikationsregeln vorgehen, deren Zuordnung von Objekten in Klassen auf einer Transformationder am Objekt beobachteten Prädiktorwerte beruht mit der die Zugehörigkeit des Objektes in den Klassen bewertet wird.Die Hauptschwierigkeit besteht in einer angemessenen Skalierung von Zugehörigkeitswerten, so dass Zugehörigkeitswerte, die mit verschiedenen Klassifikationsverfahren gewonnen werden, direkt miteinander verglichen werden können. Eine Lösung dieses Problems wird in der Arbeit vorgelegt.Mit angemessen skalierten Zugehörigkeitswerten können Klassifikationsregeln nicht nur bezüglich ihrer FähigkeitObjekte richtig zu klassifizieren bewertet werden, sondern auch hinsichtlich ihrer Fähigkeit, die Zugehörigkeit von Objekten in Klassen zuverlässig zu quantifizieren. In der Arbeit werden Maße zur Beurteilung dieser Fähigkeit vorgestellt.In einer versuchsgeplanten, komparativen Simulationsstudie werden die Möglichkeiten der eingeführten Methode aufgezeigt.Neben der Analyse des Zusammenhangs von Prädiktoren und Klasse ist ein weiteres wichtiges sekundäres Ziel dieVerknüpfung von Evidenz über die Klassenzugehörigkeit mit anderen Quellen. Auch zu diesem Zwecke empfiehlt es sich, Zugehörigkeitswerte in den standardisierten Partitionsraum zu skalieren. In diesem Falle ist das Ziel der Skalierung jedoch nicht die Vergleichbarkeit mit anderen Klassifikationregeln, sondern die Vereinbarkeit mit der Information aus den anderen Quellen. Für die Kombination der Information über aktuelle Zugehörigkeit mit Information über vergangene Zugehörigkeitenin zeitabhängigen Strukturen wird deshalb eine weitere Skalierungsmethode vorgestellt, mit der diese beiden Informationen geeignet gewichtet werden. In einer Simulationsstudie werden verschiedene Kombinationsmethoden miteinander verglichen.
In this work we propose to represent classification rules ina so-called standardized partition space. This offers a unifying framework for the representation of a wide variety of classification rules.Standardized partition spaces can be utilized for any processing of classification rules that goes beyond their primal goal, the assignment of objects to a fixed number of classes on the basis of observed predictor values.An important secondary goal in many classification problemsis to gain a deeper understanding of the relationship between the predictors and the class membership. A standard approach in this respect is to look at the induced partitions by means of the decision boundaries in the predictor space.The comparison of partitions generated by different classification methods for the same problem is performed to detect procedure-invariantly confirmed relations. In general, such comparisons serve for the representation of the different potential relationships methods can model.In high-dimensional predictor spaces, and with respect to a wide variety of classifiers with largely diverse decision boundaries, such a comparison may be difficult to understand.In these cases, we propose not to use the predictor space as a constant entity for the comparison but to standardize decision boundaries and regions - and to compare the classification rules with respect to the different patternsthat are generated by placing examples from some test set in these standardized regions.This is possible for any rule that bases its assignment on some transformation of observed predictor values such thatthese transformations asses the membership of the corresponding object in the classes. The main difficultyis an appropriate scaling of membership values such that membership values of different classification methods are comparable in size. We present a solution to this problem.Given appropriately scaled membership values we can rank classification rules not only with respect to their ability to assign objects correctly to classes but also with respect to their ability to quantify the membership of objects in classes reliably. We introduce measures for the evaluation of the performance of classification rules in this respect.In designed simulation study we realize a comparativestudy of classification rules to demonstrate the possibilities of the suggested method.Another important secondary goal is the combination of the evidence on the class membership with evidence from other sources. For that purpose, we also propose to scalemembership values into the standardized partition space. Only in this case, the goal of the scaling is not the comparability to other classification rules, but the compatibility with the information from other sources. Therefore, we present an additional scaling procedurethat weights current membership information of objects in classes with information about past memberships in dynamic domains. In a simulation study, various combination strategies are compared.
Subject Headings: classification
statistics
machine learning
partition spaces
experimental design
dynamic classification
Klassifikation
Statistik
Maschinelles Lernen
Partitionsräume
Versuchsplanung
Dynamische Klassifikation
URI: http://hdl.handle.net/2003/2789
http://dx.doi.org/10.17877/DE290R-14912
Issue Date: 2002-08-07
Publisher: Universität Dortmund
Appears in Collections:Lehrstuhl Computergestützte Statistik

Files in This Item:
File Description SizeFormat 
garczarek_rev.pdfDNB1 MBAdobe PDFView/Open


This item is protected by original copyright



All resources in the repository are protected by copyright.