Authors: Malcherczyk, Dennis
Title: K-sign depth: Asymptotic distribution, efficient computation and applications
Language (ISO): en
Abstract: Die Vorzeichen-Tiefe (sign depths) entspricht in vielen Situationen der Simplex-Regressionstiefe (simplicial regression depth), welche wiederum verwandt mit der von Rousseeuw 1999 eingeführten Regressionstiefe ist. Diese Klasse von Tiefen bewerten Parameter assoziiert zu einem statistischen Modell für gegebene Daten. Die Regressionstiefe und Simplex-Regressionstiefe sind kompliziert zu berechnen und zu verstehen. Die Vorzeichen-Tiefe entspricht hingegen nur der relativen Anzahl von geordneten Tupeln der Länge K mit alternierenden Vorzeichen. Die Arbeit gliedert sich in drei große Teile. Im ersten Teil (Kapitel 3) wird die asymptotische Verteilung der Vorzeichen-Tiefen für beliebige Hyperparameter K hergeleitet. Diese Rechnung basiert auf einen Beweis von Kustosz, Leucht und Müller aus dem Jahr 2016 für die asymptotische Verteilung des Spezialfalls K=3. Die Masterarbeit von Malcherczyk im Jahr 2018 hat diesen Beweis studiert und anschließend stark vereinfachen können. Durch diese Vereinfachung konnte auch ein Beweis für den Fall K=4 gefunden werden. Kapitel 3 ist eine Fortsetzung der Resultate aus der Masterarbeit für allgemeines K. Ein wesentlicher Schritt in der Herleitung ist die Darstellung der Vorzeichen-Tiefe als stetiges Funktional von symmetrischen Irrfahrten auf dem Skorokhod-Raum, wodurch mithilfe eines funktionalen Zentralen Grenzwertsatzes und einem Stetigkeitsargument die asymptotische Verteilung gewonnen wird. Im zweiten Teil (Kapitel 4 und 5) werden verschiedene effiziente Berechnungsmöglichkeiten vorgestellt, da ein Algorithmus basierend auf der Definition eine polynomielle Rechenkomplexität mit Polynomgrad K aufweist. In Kapitel 4 wird ein Algorithmus basierend auf der asymptotischen Herleitung konstruiert, während in Kapitel 5 ein simpler Ansatz basierend auf der Zusammenfassung von Vorzeichen-Blöcken beschrieben wird. Es zeigt sich, dass der Ansatz in Kapitel 5 zu einem exakten Algorithmus mit linearer Laufzeit (unabhängig von K) führt. Im dritten Teil (Kapitel 6 und 7) werden Testverfahren basierend auf der Vorzeichen-Tiefe beschrieben und in Simulationsstudien untersucht. Anwendungen sind das Testen von Modellen und das Testen auf Zufälligkeit. Weitere Themen in diesem Zusammenhang sind z.B. die Wahl des Hyperparameters oder die Konstruktion eines Zwei-Stichproben-Tests für relevante Unterschiede. Ferner werden Ausblicke für zukünftige Forschung gegeben. Die Vorzeichen-Tiefe können z.B. modifiziert werden, sodass die Vorzeichen unterschiedlich gewichtet sind. Diese Gewichte basieren u.a. auf einem für die robuste Statistik typischen Huber-Gewicht oder auf Vorzeichen-Rängen. Kombiniert mit den Resultaten der Dissertation von Melanie Horn aus dem Jahre 2021, die sich insbesondere mit der Anwendung der Vorzeichen-Tiefe in hoch dimensionalen Modellen beschäftigt, ist eine Grundlage geschaffen worden, um die Vorzeichen-Tiefe in der Praxis sinnvoll nutzen zu können. Besonders an dem Ansatz der Vorzeichen-Tiefe ist, dass Modelle lediglich basierend auf den Residuen bewertet werden können. Dies bietet auch die Möglichkeit, nichtparametrische Modelle zu bewerten.
The sign depth corresponds under many situations to the simplicial regression depth which is closely related to the regression depth introduced by Rousseeuw (1999). This class of depth notions evaluates parameters associated to a model function for given data. The regression depth and simplicial regression depth are complicated to compute and to comprehend. On the contrary the sign depth is simply the relative number of tuples of length K with alternating signs. This thesis is structured in three main parts. In the first part (Chapter 3) the asymptotic distribution is derived for arbitrary hyper parameters. This derivation is based on the proof of Kustosz, Leucht and Müller (2016) for the case K=3. The Master thesis Malcherczyk (2018) analyzed this proof and found a strongly simplified proof which also yields to a proof for K=4. Chapter 3 continues these results for general K. A substantial step of the proof is the representation of the sign depth by a functional with paths of a symmetric random walk in the Skorokhod space. By applying a functional Central Limit Theorem and the Continuous Mapping Theorem, the asymptotic distribution can be obtained. The second part (Chapter 4 and 5) proposes various approaches for efficient computation since the computational costs of an algorithm based on the definition of the sign depth increase in polynomial time to the power of K. Chapter 4 provides an algorithm based on the asymptotic derivation and Chapter 5 is based on an elementary idea considering the sign block structures of the residuals. The algorithm in Chapter 5 has linear time complexity for arbitrary K. The third part (Chapter 6 and 7) introduces several types of tests based on the sign depth and presents associated simulation studies. One application is the diagnose of models and another one is testing randomness of data. Further topics are for example the choice of the hyper parameter or the construction of a two-sample relevance-test. Moreover ideas for generalized version of the sign depth based on weighted signs for higher efficiency in general cases are given. For example, weighted signs based on Huberized versions of the residuals or signed ranks are introduced. Combined with the results of Horn (2021) who applied the sign depth in high-dimensional models, the fundamentals for future research are obtained. The sign depth has the special property that models can be evaluated only by considering the residual vector. Therefore nonparametric model classes can be considered as well.
Subject Headings: Regression depth
Model check
Sign
Rank
U-statistics
Subject Headings (RSWK): Regressionsanalyse
Robuste Schätzung
Datentiefe
Programmpaket
URI: http://hdl.handle.net/2003/40787
http://dx.doi.org/10.17877/DE290R-22644
Issue Date: 2022
Appears in Collections:Lehrstuhl Statistik mit Anwendungen im Bereich der Ingenieurwissenschaften

Files in This Item:
File Description SizeFormat 
Dissertation.pdfDNB2.9 MBAdobe PDFView/Open


This item is protected by original copyright



Items in Eldorado are protected by copyright, with all rights reserved, unless otherwise indicated.