Multimodale Likelihood-Funktionen in Mischverteilungsmodellen

dc.contributor.advisorWeihs, Claus
dc.contributor.authorJastrow, Malte
dc.contributor.refereeLigges, Uwe
dc.date.accepted2021-10-26
dc.date.accessioned2021-09-08T11:49:33Z
dc.date.available2021-09-08T11:49:33Z
dc.date.issued2021
dc.description.abstractMischverteilungsmodelle (Mixture Models) dienen allgemein zur Anpassung zusammengesetzter Verteilungen an Daten, in denen einzelne Gruppen von Beobachtungen unterschiedlichen Verteilungen folgen. Durch die Modellierung der Gruppenzugehörigkeiten als latente Variable sind diese Modelle darüber hinaus ein populäres Verfahren zur Clusteranalyse (unüberwachtes Lernen). Dabei werden die Gruppen, denen Beobachtungen zugeordnet werden sollen, durch unterschiedlich parametrisierte Verteilungskomponenten repräsentiert. Die Verteilungsparameter der einzelnen Komponenten, sowie deren Mischungsverhältnis können mittels Maximum-Likelihood-Prinzip geschätzt werden. Wie in der Literatur beschrieben, kann die Likelihood-Funktion bereits für die Mischung zweier Normalverteilungskomponenten zahlreiche Optima aufweisen, wenn sich die zugrundeliegenden Varianzen stark unterscheiden. Im Rahmen dieser Dissertation wird das Problem der Multimodalität zunächst für Mischungen verschiedener Verteilungen durch grafische Darstellungen verdeutlicht. Anschließend wird systematisch der Einfluss der zugrundeliegenden Parameter der Mischverteilungsmodelle untersucht. Dabei ergibt sich, dass die Multimodalität maßgeblich mit dem Abstand zwischen den Varianzparametern der beiden Mischungskomponenten ansteigt. Anhand einer umfangreichen Simulationsstudie wird untersucht, wie gut der üblicherweise verwendete EM-Algorithmus Normalverteilungsmischungen mit unterschiedlicher Komplexität der Likelihood optimieren kann. Es stellt sich heraus, dass EM gegenüber allgemeinen Black-Box-Optimierungsalgorithmen, die spezielle Ansätze zum Überwinden lokaler Optima verfolgen, im Vorteil ist, da die in jedem Schritt verwendete konkrete Zuordnung der Daten zu den Verteilungskomponenten eine erhebliche Vereinfachung der Zielfunktion verursacht. Darüber hinaus wird mit der Methode der Clusterstartpunkte für EM eine für den Anwendungsfall relevante Methode vorgeschlagen, um möglichst viele lokale Optima einer multimodalen Likelihood-Funktion zu identifizieren. Dies gelingt deutlich besser als mit der häufig praktizierten Verwendung von Zufallsstartpunkten für EM und kann einen entscheidenden Beitrag zur Bewertung eines globalen Optimierungsergebnisses in der Praxis liefern.de
dc.identifier.urihttp://hdl.handle.net/2003/40489
dc.identifier.urihttp://dx.doi.org/10.17877/DE290R-22361
dc.language.isodede
dc.subjectMixture modelsde
dc.subjectEM-Algorithmusde
dc.subjectGlobale Optimierungde
dc.subjectClusteringde
dc.subject.ddc310
dc.subject.rswkMultimodale Verteilungde
dc.subject.rswkMaximum-Likelihood-Schätzungde
dc.subject.rswkGlobale Optimierungde
dc.titleMultimodale Likelihood-Funktionen in Mischverteilungsmodellende
dc.typeTextde
dc.type.publicationtypedoctoralThesisde
dcterms.accessRightsopen access
eldorado.dnb.deposittruede
eldorado.secondarypublicationfalsede

Dateien

Originalbündel

Gerade angezeigt 1 - 1 von 1
Lade...
Vorschaubild
Name:
diss_jastrow.pdf
Größe:
16.55 MB
Format:
Adobe Portable Document Format
Beschreibung:
DNB

Lizenzbündel

Gerade angezeigt 1 - 1 von 1
Lade...
Vorschaubild
Name:
license.txt
Größe:
4.85 KB
Format:
Item-specific license agreed upon to submission
Beschreibung: