Online Diskriminanzanalyse für Datensituationen mit Concept Drift

dc.contributor.advisorLigges, Uwe
dc.contributor.authorSchnackenberg, Sarah Anna
dc.contributor.refereeWeihs, Claus
dc.date.accepted2020-06-10
dc.date.accessioned2021-02-19T07:29:27Z
dc.date.available2021-02-19T07:29:27Z
dc.date.issued2020
dc.description.abstractVor dem Hintergrund der Existenz von immer mehr Datenströmen anstelle von Batch-Daten gewinnen Online-Algorithmen immer mehr an Bedeutung. Eine wesentliche Eigenschaft von Datenströmen besteht darin, dass sich die den Beobachtungen zugrunde liegende Verteilung im Laufe der Zeit ändern kann. Für solche Situationen hat sich der Begriff concept drift etabliert. Die Dissertation fokussiert auf die Diskriminanzanalyse als ein mögliches Klassifikationsverfahren. Viele bisher publizierte Algorithmen für Online Diskriminanzanalyse haben gemein, dass zwar eine Adaption an einen concept drift ermöglicht wird, eine kontinuierlich fortschreitende Veränderung der Verteilung allerdings nicht beachtet wird, sodass veraltete (und daher verzerrte) Schätzer in die Klassifikationsregel zur Prognose einfließen. In der Dissertation wird eine Methodik zur Erweiterung von Methoden für Online Diskriminanzanalyse zur Verbesserung der Prognosegüte für Datensituationen mit concept drift entwickelt. Für die Erweiterung wird der concept drift geeignet modelliert und prognostiziert. Es wird ein linearer Trend der Erwartungswertvektoren über die Zeit unterstellt, welcher mit lokaler linearer Regression modelliert wird. So können kontinuierlich die Erwartungswertvektoren des kommenden Zeitpunktes für jede Klasse prognostiziert werden. Diese Prognosen ersetzen laufend die bisherigen Schätzer in der jeweiligen Klassifikationsregel der Online Diskriminanzanalyse, um eine bessere Prognose für Beobachtungen des folgenden Zeitpunktes gewährleisten zu können. Durch die Lokalität lokaler linearer Regressionsmodelle können auch nicht-lineare Trends geeignet linear approximiert werden. Für Spezialfälle wird bewiesen, dass die Schätzfunktionen für die Erwartungswertvektoren der Klassen der erweiterten Methoden jeweils erwartungstreu für die Erwartungswertvektoren der Verteilung der Prognose sind. Die theoretischen Ergebnisse werden durch eine umfangreiche Simulationsstudie untermauert und erweitert. Für die Evaluierung werden Datenströme mit unterschiedlichen Arten und Stärken von concept drift als Ausprägungen des unendlichen Raumes aller möglichen Datensituationen mit concept drift simuliert. Die ursprünglichen sowie die erweiterten Methoden werden auf diesen Datensituationen hinsichtlich der Prognosegüte miteinander verglichen. Die Prognosegüte der Klassifikatoren kann durch Erweiterung der Methoden unter verschiedenster Formen von concept drift verbessert werden.de
dc.identifier.urihttp://hdl.handle.net/2003/40038
dc.identifier.urihttp://dx.doi.org/10.17877/DE290R-21919
dc.language.isodede
dc.subjectDiskriminanzanalysede
dc.subjectKlassifikationsverfahrende
dc.subjectConcept driftde
dc.subject.ddc310
dc.subject.rswkDiskriminanzanalysede
dc.subject.rswkClusterverfahrende
dc.titleOnline Diskriminanzanalyse für Datensituationen mit Concept Driftde
dc.typeTextde
dc.type.publicationtypedoctoralThesisde
dcterms.accessRightsopen access
eldorado.dnb.deposittruede
eldorado.secondarypublicationfalsede

Dateien

Originalbündel

Gerade angezeigt 1 - 1 von 1
Lade...
Vorschaubild
Name:
Dissertation_Schnackenberg2020.pdf
Größe:
33.91 MB
Format:
Adobe Portable Document Format
Beschreibung:
DNB

Lizenzbündel

Gerade angezeigt 1 - 1 von 1
Lade...
Vorschaubild
Name:
license.txt
Größe:
4.85 KB
Format:
Item-specific license agreed upon to submission
Beschreibung: