Robustheitskonzepte und -untersuchungen für Schätzer konvexer Körper
Loading...
Date
2003-01-17
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Universität Dortmund
Abstract
In dieser Arbeit werden Schätzer für konvexe Körper auf ihr Bruchpunktverhalten untersucht, sowie Schätzer für konvexe Körper vorgeschlagen, die einen hohen Bruchpunkt aufweisen. Der finitesample Bruchpunkt für den Schätzer eines beliebigen Parameters gibt den kleinsten Anteil von Beobachtungen einer Stichprobe an, die ausgetauscht werdenmüssen, bevor dieser Schätzer 'zusammenbricht'. Der Zusammenbruch wird dabei basierend auf einer geeigneten Me trik auf dem Parameterraum definiert. In der hier betrachteten Situation sind die zu schätzenden Parameter der Verteilung konvexe Körper. Eine geeignete Metrik für konvexe Körper ist der Hausdorff Abstand. Entsprechend bricht ein Schätzer für einen konvexen Körper zusammen, wenn der Hausdorff Abstand zwischen den Schätzungen dieses konvexenKörpers basierend auf der regulären und der kontaminierten Stichprobe beliebig groß wird. Andererseits sollte ebenfalls von einem Zusammenbruch dieses Schätzers gesprochen werden, wenn er zu einem niedrigerdimensionalen Gebilde degeneriert. Dies geschieht, falls der Hausdorff Abstand zwischen denSchätzungen für die Polarmenge des konvexen Körpers basierend auf der regulären und der kontaminierten Stichprobe beliebig groß wird. Die in dieser Arbeit vorgestellte Definition betrachtet beide Arten des Zusammenbruchs und erlaubt somit die Untersuchung vorhandener Schätzer konvexer Körper bzgl. ihres Bruchpunktverhaltens. Beispiele konvexer Körper sind Liftzonoide und Zonoide von Verteilungen. Diese konvexenKörper weisen die Besonderheit auf, dass sie dem Erwartungswert eines zufälligen konvexen Körper ent sprechen. Sie können somit als Parameter einer Verteilung interpretiert werden. Liftzonoide erlauben zudem die eineindeutige Beschreibung einer Verteilung. Die bisherige Schätzung von Liftzonoiden bzw. Zonoiden basiert auf Polytopen, d.h. konvexen Hüllen einer endlichen Punktmenge. Es zeigt sich, dass bei dieser Art der Schätzung schon eine einzelne Beobachtung ausreicht, um die Schätzung im Sinne der vorgestellten Bruchpunktdefinition zusammen brechen zu lassen. Weiterhin werden zwei Arten von KonturToleranzbereichen vorgestellt. Die so genannten MahalanobisBereiche werden durch den Erwartungswert und der Kovarianz der zugrunde liegenden Verteilung eineindeutig bestimmt. Eine Schätzung dieser konvexen Körper ergibt sich basierend auf der Schätzung der entsprechenden Momente. Da es eine eineindeutige Zuordnung zwischen den ersten beiden Momenten der Verteilung und den MahalanobisBereichen gibt, wird das Bruchpunktverhalten der Schätzung dieses konvexenKörpers durch das Bruchpunktverhalten der Lokations und Kovarianzschätzer bestimmt. Des Weiteren wird ein KonturToleranzbereich eingeführt, der eng mit Liftzonoiden verbunden ist, die so genannten zonoiden Zonen. Auch hier 1 zeigt sich, dass die Schätzung der zonoiden Zonen gegenüber Ausreißern sehr anfällig ist, da schon eine einzelne Beobachtung ausreicht, um die Schätzung im Sinneder vorgeschlagenen Bruchpunktdefinition zusammen brechenzu lassen. Da keiner der betrachteten Schätzer die obere Bruchpunktschranke innerhalb seiner Schätzerklasse annimmt, werden vorhandene Schätzer konvexer Körper soweit modifiziert, dass sie den größten Bruchpunkt aufweisen. Dazu wird aus einer gegebenen Stichprobe eine geeignete Teilstichprobe bestimmt, die unter allen zulässigen Teilstichproben ein festgelegtes Variabilitätsmaß minimiert. Die so erhaltene Teilstichprobe wird zur Schätzung der interessierenden konvexen Körper verwendet. Dieses Prinzip ist anwendbar auf Schätzer, die auf Polytopen basieren. Die so erhaltenen Schätzer nehmen die obere Bruchpunktschranke innerhalb ihrer Schätzerklassen an. In dieser Arbeit wird außerdem ein weiteres Kriterium vorgeschlagen, welches auf dem Volumen des geschätzen Zonoids basiert (MZEKriterium). Dieses Volumen kann als Variabilitätsmaß aufgefasst werden. Wird ein konvexer Körper basierend auf derjenigen Stichprobe geschätzt, die das MZEKriterium minimiert, so weist auch dieser Schätzer den größten Bruchpunkt innerhalb seinerSchätzerklasse auf. Weiterhin wird das MZEKriterium zur Definition von Lokations bzw. Kovarianzschätzer benutzt.Die resultierenden Schätzer sind affin äquivariant undnehmen die oberen BruchpunktSchranken innerhalb ihrerSchätzerklassen an.
As notion for robustness, a finite sample breakdown point definition for estimators of convex bodies is presented by using ideas from convex geometry. The estimation of a convex body arises in variety of contexts, ranging confidence ellipsoids to the estimation of depth contours that emerge naturally out of the concept of data depth. It is frequently mentioned that the estimation of these convex bodies can be heavily influenced by outliers in the dataset. On the one hand, outliers may cause the estimated convex body to grow beyond any measure (explosion); on the other hand, the estimator may degenerate to a lower dimensional shape (implosion). Until now there has not existed a notion describing these e#ects appropriately. A new breakdown point definition is proposed. Based on the Hausdor#metric, this definition simultaneously takes into account the explosion and implosion of a convex body estimator. The proposed definition is appropriate to calculate the breakdown point of location and scale estimators as well. The breakdown points for several convex body estimators are calculated, such as contour of depth estimators and polytopebased estimators. It turns out that for many estimators only one bad observation can cause breakdown. To attain estimators of convex bodies with high breakdown point, new estimators are introduced based on a new half sample criterion (Minimum Zonoid Estimation Criterion (MZECriterion)). The criterion seeks the subsample that minimizes the volume of the estimated zonoid. This subsample is used to estimate the convex body. New multivariate a#ne equivariant location and scatter estimators are also introduced by using this MZEcriterion. These estimators attain the highest possible breakdown point for location and scatter estimators
As notion for robustness, a finite sample breakdown point definition for estimators of convex bodies is presented by using ideas from convex geometry. The estimation of a convex body arises in variety of contexts, ranging confidence ellipsoids to the estimation of depth contours that emerge naturally out of the concept of data depth. It is frequently mentioned that the estimation of these convex bodies can be heavily influenced by outliers in the dataset. On the one hand, outliers may cause the estimated convex body to grow beyond any measure (explosion); on the other hand, the estimator may degenerate to a lower dimensional shape (implosion). Until now there has not existed a notion describing these e#ects appropriately. A new breakdown point definition is proposed. Based on the Hausdor#metric, this definition simultaneously takes into account the explosion and implosion of a convex body estimator. The proposed definition is appropriate to calculate the breakdown point of location and scale estimators as well. The breakdown points for several convex body estimators are calculated, such as contour of depth estimators and polytopebased estimators. It turns out that for many estimators only one bad observation can cause breakdown. To attain estimators of convex bodies with high breakdown point, new estimators are introduced based on a new half sample criterion (Minimum Zonoid Estimation Criterion (MZECriterion)). The criterion seeks the subsample that minimizes the volume of the estimated zonoid. This subsample is used to estimate the convex body. New multivariate a#ne equivariant location and scatter estimators are also introduced by using this MZEcriterion. These estimators attain the highest possible breakdown point for location and scatter estimators
Description
Table of contents
Keywords
Konvexe Körper, Stützfunktion, Polarmenge, affin aquivariante Schätzer, hoher Bruchpunkt, Zonoid, Polytope, MZEKriterium, Convex body, support function, polar set, affine equivariant estimators, high breakdown point, zonoid, polytope, MZEcriterion