Full metadata record
DC FieldValueLanguage
dc.contributor.advisorWeihs, Claus-
dc.contributor.authorJastrow, Malte-
dc.date.accessioned2021-09-08T11:49:33Z-
dc.date.available2021-09-08T11:49:33Z-
dc.date.issued2021-
dc.identifier.urihttp://hdl.handle.net/2003/40489-
dc.identifier.urihttp://dx.doi.org/10.17877/DE290R-22361-
dc.description.abstractMischverteilungsmodelle (Mixture Models) dienen allgemein zur Anpassung zusammengesetzter Verteilungen an Daten, in denen einzelne Gruppen von Beobachtungen unterschiedlichen Verteilungen folgen. Durch die Modellierung der Gruppenzugehörigkeiten als latente Variable sind diese Modelle darüber hinaus ein populäres Verfahren zur Clusteranalyse (unüberwachtes Lernen). Dabei werden die Gruppen, denen Beobachtungen zugeordnet werden sollen, durch unterschiedlich parametrisierte Verteilungskomponenten repräsentiert. Die Verteilungsparameter der einzelnen Komponenten, sowie deren Mischungsverhältnis können mittels Maximum-Likelihood-Prinzip geschätzt werden. Wie in der Literatur beschrieben, kann die Likelihood-Funktion bereits für die Mischung zweier Normalverteilungskomponenten zahlreiche Optima aufweisen, wenn sich die zugrundeliegenden Varianzen stark unterscheiden. Im Rahmen dieser Dissertation wird das Problem der Multimodalität zunächst für Mischungen verschiedener Verteilungen durch grafische Darstellungen verdeutlicht. Anschließend wird systematisch der Einfluss der zugrundeliegenden Parameter der Mischverteilungsmodelle untersucht. Dabei ergibt sich, dass die Multimodalität maßgeblich mit dem Abstand zwischen den Varianzparametern der beiden Mischungskomponenten ansteigt. Anhand einer umfangreichen Simulationsstudie wird untersucht, wie gut der üblicherweise verwendete EM-Algorithmus Normalverteilungsmischungen mit unterschiedlicher Komplexität der Likelihood optimieren kann. Es stellt sich heraus, dass EM gegenüber allgemeinen Black-Box-Optimierungsalgorithmen, die spezielle Ansätze zum Überwinden lokaler Optima verfolgen, im Vorteil ist, da die in jedem Schritt verwendete konkrete Zuordnung der Daten zu den Verteilungskomponenten eine erhebliche Vereinfachung der Zielfunktion verursacht. Darüber hinaus wird mit der Methode der Clusterstartpunkte für EM eine für den Anwendungsfall relevante Methode vorgeschlagen, um möglichst viele lokale Optima einer multimodalen Likelihood-Funktion zu identifizieren. Dies gelingt deutlich besser als mit der häufig praktizierten Verwendung von Zufallsstartpunkten für EM und kann einen entscheidenden Beitrag zur Bewertung eines globalen Optimierungsergebnisses in der Praxis liefern.de
dc.language.isodede
dc.subjectMixture modelsde
dc.subjectEM-Algorithmusde
dc.subjectGlobale Optimierungde
dc.subjectClusteringde
dc.subject.ddc310-
dc.titleMultimodale Likelihood-Funktionen in Mischverteilungsmodellende
dc.typeTextde
dc.contributor.refereeLigges, Uwe-
dc.date.accepted2021-10-26-
dc.type.publicationtypedoctoralThesisde
dc.subject.rswkMultimodale Verteilungde
dc.subject.rswkMaximum-Likelihood-Schätzungde
dc.subject.rswkGlobale Optimierungde
dcterms.accessRightsopen access-
eldorado.secondarypublicationfalsede
Appears in Collections:Lehrstuhl Computergestützte Statistik

Files in This Item:
File Description SizeFormat 
diss_jastrow.pdfDNB16.94 MBAdobe PDFView/Open


This item is protected by original copyright



This item is protected by original copyright rightsstatements.org