Casjens, Swaantje Wiarda2013-07-222013-07-222013-07-22http://hdl.handle.net/2003/3043110.17877/DE290R-5588Bei der Herleitung eines Klassifikationsmodells ist neben der Vorhersagegüte auch die Güte der Variablenauswahl ein wichtiges Kriterium. Bei Einflussvariablen mit unterschiedlichen Kosten ist eine kostensensitive Klassifikation erstrebenswert, bei der ein Kompromiss aus hoher Vorhersagegüte und geringen Kosten getroffen werden kann. Werden konfliktäre Ziele, wie etwa hier die Vorhersagegüte und die Kosten, gleichzeitig optimiert, entsteht ein mehrkriterielles Optimierungsproblem, für das keine einzelne sondern eine Menge unvergleichbarer Lösungen existieren. Für das Auffinden der unvergleichbaren Lösungen sind evolutionäre mehrkriterielle Optimierungsalgorithmen (EMOAs) gut geeignet, da sie unter anderem nach verschiedenen Lösungen parallel suchen können und unabhängig von der zugrunde liegenden Datenverteilung sind. Häufig werden EMOAs für die Lösung mehrkriterieller Klassifikationsprobleme in Form von Wrapper-Ansätzen verwendet, wobei die EMOA-Individuen als binäre Zeichenketten (Bitstrings) codiert sind und jedes Bit die Verfügbarkeit der entsprechenden Einflussvariable beschreibt. Basierend auf diesen Variablenteilmengen und gegebenen Daten erstellt der umhüllte (wrapped) Klassifikationsalgorithmus ein Klassifikationsmodell, mit dem Ziel die Vorhersagegüte zu optimieren. Erst nach der Konstruktion des Klassifikationsmodells können weitere Zielkriterien, wie etwa die Kosten der selektierten Variablen, ausgewertet werden. Damit entsteht eine Hierarchie der zu optimierenden Zielkriterien mit Vorteil für die Vorhersagegüte, sodass durch einen mehrkriteriellen Wrapper-Ansatz keine nicht-hierarchischen Lösungen gefunden werden können. Diese Hierarchie der Zielfunktionen wird erstmals in Rahmen dieser Arbeit beschrieben und untersucht. Als Alternative zum mehrkriteriellen Wrapper-Ansatz wird in dieser Arbeit ein nicht-hierarchischer evolutionärer mehrkriterieller Optimierungsalgorithmus mit Baum-Repräsentation (NHEMOtree) entwickelt, um mehrkriterielle Optimierungsprobleme mit gleichberechtigten Optimierungszielen zu lösen. NHEMOtree basiert auf einem EMOA mit Baum-Repräsentation, der ohne internen Klassifikationsalgorithmus die Variablenselektion vollzieht und ohne Hierarchie in den Zielfunktionen mehrkriteriell optimierte binäre Entscheidungsbäume erstellt. Des Weiteren werden ein auf mehrkriteriellen Variablenwichtigkeitsmaßen (VIMs) basierter Rekombinationsoperator für NHEMOtree und eine NHEMOtree-Version mit lokaler Cutoff-Optimierung entwickelt. In dieser Arbeit werden erstmalig die Lösungen einer mehrkriteriellen Optimierung durch einen mehrkriteriellen Wrapper-Ansatz und durch einen EMOA mit Baum-Repräsentation (NHEMOtree) miteinander verglichen. Die Bewertung der Lösungen erfolgt dabei sowohl mittels der bekannten S-Metrik als auch durch den hier entwickelten Dominanzquotienten. Die Güte des VIM-basierten Rekombinationsoperators wird im Vergleich zum Standard-Rekombinationsoperator für EMOAs mit Baum-Repräsentation untersucht. Die mehrkriteriellen Optimierungsansätze und Operatoren werden auf medizinische und simulierte Daten angewendet. Die Ergebnisse zeigen, dass NHEMOtree bessere Lösungen als der mehrkriterielle Wrapper-Ansatz findet. Die Verwendung des VIM-basierten Rekombinationsoperators führt im Gegensatz zum Standard-Operator zu nochmals besseren Lösungen des mehrkriteriellen Optimierungsproblems und zu einer schnelleren Konvergenz des NHEMOtrees.deBaum-Repräsentationevolutionäre Algorithmenkostensensitive Klassifikationmehrkriterielle OptimierungVariablenwichtigkeitsmaße310Adaption und Vergleich evolutionärer mehrkriterieller Algorithmen mit Hilfe von VariablenwichtigkeitsmaßenAm Beispiel der kostensensitiven Klassifikation von Lungenkrebssubtypendoctoral thesis