Stabile Variablenselektion in der Klassifikation
Loading...
Date
2016-03-18
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Diese Masterarbeit behandelt das Thema der Stabilität der Variablenselektion im Rahmen der Klassifikation. Klassifikationsverfahren wählen aus, welche Variablen aus den Trainingsdaten in der Klassifikationsregel verwendet werden. Die Stabilität der Variablenselektion eines Klassifikationsverfahrens beschreibt die Ähnlichkeit der Mengen gewählter Variablen, wenn das Verfahren auf mehreren ähnlichen Trainingsdatensätzen angepasst wird.
Um für konkrete Trainingsdaten solche Klassifikationsregeln zu erhalten, die nicht nur eine hohe Klassifikationsgüte aufweisen, sondern auch eine stabile Auswahl einer geringen Anzahl an Variablen durchführen, werden alle drei Zielkriterien bereits beim Parametertuning berücksichtigt. In dieser Arbeit werden mehrere Ansätze dafür vorgestellt und verglichen. Zudem erfolgt ein ausführlicher Vergleich verschiedener Stabilitätsmaße.