Ausreißeridentifikation für kategoriale und funktionale Daten im generalisierten linearen Modell
Loading...
Date
2017-03-09
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
In der vorliegenden Arbeit werden Verfahren zur Identifikation von Ausreißern in generalisierten linearen Modellen entwickelt. Der Fokus liegt dabei auf kategorialen und funktionalen Zielgrößen. In generalisierten linearen Modellen wird für die Zielgröße eine Verteilung aus der Exponentialfamilie angenommen. Somit können die Zielgrößen dahingehend analysiert werden, ob unter der Verteilungsannahme ungewöhnliche Werte realisiert werden. Hierzu wird das Konzept der α-Ausreißer herangezogen. Mit Hilfe robuster Kerndichteschätzer wird dieses Konzept auf Situationen erweitert, in denen kein Verteilungstyp angenommen wird. Ein wichtiges Ergebnis in dieser Arbeit betrifft die Ausreißeridentifikation einzelner Zellen in Kontingenztafeln, die durch loglineare Poissonmodelle beschrieben werden. Hierfür wird das Minimalmusterverfahren zu einem eindeutig bestimmten Ausreißeridentifizierer erweitert. Ein Minimalmuster besteht aus einer Teilmenge der Zellen einer Kontingenztafel, deren Elemente als potenziell ausreißerfrei aufgefasst werden. Die Performanz dieses Verfahrens wird in realen Datensätzen und Simulationsstudien beurteilt. Zur Wahl von Zellen einer Kontingenztafel, die Teil eines Minimalmusters sind, wird die Relevanz bestimmter geometrischer Strukturen, der sogenannten k-Schlingen, hervorgehoben. In funktionalen Daten können Ausreißeridentifizierer basierend auf Datentiefen definiert werden. Dabei liegt der Fokus der in der Literatur vorhandenen Datentiefen jedoch nicht auf der Form der Daten. Diese Lücke wird in dieser Arbeit zwei neue Pseudo-Datentiefen zur Identifikation von Form-Ausreißern geschlossen. Ihre Eigenschaften werden sowohl theoretisch als auch basierend auf echten sowie künstlichen Datensätzen analysiert und darüber hinaus im Kontext generalisierter linearer Modelle mit funktionaler Zielgröße beurteilt. Dabei wird auch eine eventuelle Fehlspezifikation des generalisierten linearen Modells berücksichtigt. Des Weiteren werden Verfahren zur Identifikation von Ausreißern in Gaußprozessen basierend auf dem Konzept der α-Ausreißer resp. Bagplots entwickelt.
Description
Table of contents
Keywords
Ausreißererkennung, Funktionale Zielgrößen, Kontingenztafeln