TU-weit zugängliche Prüfungsarbeiten
Permanent URI for this collection
Browse
Recent Submissions
Item Vergleich verschiedener Verteilungen für die Modellierung von Jahreshöchstabflüssen(2016-11-15) Duda, Julia; Fried, Roland; Fried, Roland; Rahnenführer, JörgInhalt dieser Arbeit ist es, verschiedene potentiell geeignete Verteilungen für die Anpassung an Maximalwerte von Fließgewässern (z.B. Jahreshöchstabflüsse) zu vergleichen. Betrachtet werden die Lognormalverteilung, Log-Laplaceverteilung, generalisierte Extremwertverteilung, Pearson-Typ-3- Verteilung und Log-Pearson-Typ-3-Verteilung. Der Vergleich erfolgt durch eine Simulationsstudie. Dabei werden Daten aus den genannten Verteilungen generiert und jede der besagten Verteilungen wiederum an die erstellten Datensätze angepasst. Die Anpassung erfolgt mittels des Maximum-Likelihood-Prinzip. Mit Hilfe des Anderson-Darling- Tests wird über einen parametrischen Bootstrap ein kritischer Wert approximiert. Zusätzlich wird eine neue verallgemeinerte Version der Anderson-Darling-Teststatistik vorgeschlagen, die eine flexiblere Gewichtung ermöglicht.Item Anwendung von Markov-Switching-Modellen auf Zeitreihendaten zur Überwachung von Vorhofflimmern(2016-11-30) König, Jana Maria; Fried, Roland; Fried, Roland; Doebler, PhilippItem Klassische Regression in der modellgestützten Optimierung(2016-06-16) Jastrow, Malte; Weihs, Claus; Weihs, Claus; Ligges, UweIn dieser Arbeit geht es um die Verwendung von klassischen Regressionsmodellen im Rahmen der modellgestützten Optimierung. Im etablierten EGO-Verfahren wird Kriging als Surrogat-Modell der Zielfunktion verwendet, um kosten- oder zeitintensive Auswertungen der Originalfunktion einzusparen. Auf Grund der Komplexität des Verfahrens bestehen allerdings Probleme für Anwender sich das Verfahren anzueignen. Daher wird im Rahmen dieser Arbeit versucht bekannte und leichter zu verstehende Regressionsmodelle anstelle von Kriging zu verwenden. Es werden verschiedene Varianten polynomieller Regressionsmodelle vorgeschlagen und in einer Simulationsstudie auf den BBOB-Funktionen mit Kriging verglichen. Außerdem wird anhand eines kostensensitiven Klassifikationsbaumes ermittelt, bei welchen Zielfunktionseigenschaften polynomielle Regression zu besseren Optimierungsergebnissen führt.Item Vergleich verschiedener Algorithmen zur Tonhöhenbestimmung von Musikdaten(2015-12-23) Stern, Jennifer; Weihs, Claus; Weihs, Claus; Ligges, UweIn der vorliegenden Arbeit werden vier verschiedene Methoden zur Grundfrequenzschätzung der Melodiestimme von Musikdaten miteinander verglichen, die Autokorrelationsmethode und der YIN-Algorithmus aus dem Zeitbereich, die Cepstrum-Methode aus dem Cepstrumbereich und der MPE-Algorithmus aus dem Frequenzbereich. Dazu werden Daten von den drei Instrumenten Cello, Klarinette und Trompete, also einem Streichinstrument, einem Holzblasinstrument und einem Blechblasinstrument untersucht. Es werden verschiedene Fehlermaße definiert und berechnet. Außerdem werden einzelne Parameter der Methoden optimiert.Item On Parameter Estimation in Cointegrating Polynomial Regressions: Single Equation, Seemingly Unrelated and Panel Estimators(2016-09-29) Reichold, Karsten; Wagner, Martin; Wagner, Martin; Krämer, WalterThis thesis studies parameter estimation and inference in systems of seemingly unrelated cointegrating polynomial regressions as introduced in Hong and Wagner (2011). These are equation systems with deterministic regressors and integrated processes and their integer powers as stochastic regressors. The stochastic regressors are allowed to be endogenous and the errors are allowed to be dynamically correlated, both over time and across equations. In particular we consider a setting relevant for the analysis of the environmental Kuznets curve (EKC) hypothesis, including only one integrated regressor and its second and third power. In this setting we compare three estimation approaches by means of a simulaton study. These are the FM-OLS type estimator for (single equation) cointegrating polynomial regressions of Wagner and Hong (2015), the SUR estimators of Hong and Wagner (2011) and panel type estimators advocated by de Jong and Wagner (2016). This thesis investigates under which conditions on sample sizes (N and T), level of endogeneity and extent of serial and cross-sectional correlation, one of the three above mentioned estimators, as well as hypothesis tests, based upon it, performs relatively best. Not forgetting the fact that the results are based on a simulation study only, they provide some guidance with respect to estimator choice in cointegrating polynomial regression settings with panel-type data.Item Stationary Regressors in Cointegrating Polynomial Regression(2016-10-11) Grupe, Maximilian; Wagner, Martin; Wagner, Martin; Ziebach, ThorstenThis thesis investigates the finite sample performance of the fully modified OLS estimator for cointegrating polynomial regressions (CPR),developed by Wagner and Hong (2016), including stationary regressors to the model. To be precise, this thesis considers regressions including deterministic variables, integrated processes, powers of integrated processes and stationary variables as explanatory variables and stationary errors. The errors are allowed to be serially correlated and the regressors are allowed to be endogenous except for the stationary regressors where both cases, i.e. predetermined or endogenous stationary regressors, are examined in this thesis. The basis for the finite sample performance investigation is a simulation study which shows that the assumption of allowing endogeneity of the stationary regressors can not be made as in this case the FM-OLS estimator seem to be not consistent anymore and statistical inference is no longer feasible for every level of serial correlation and endogeneity.Item Stabile Variablenselektion in der Klassifikation(2016-03-18) Bommert, Andrea Martina; Rahnenführer, Jörg; Rahnenführer, JörgDiese Masterarbeit behandelt das Thema der Stabilität der Variablenselektion im Rahmen der Klassifikation. Klassifikationsverfahren wählen aus, welche Variablen aus den Trainingsdaten in der Klassifikationsregel verwendet werden. Die Stabilität der Variablenselektion eines Klassifikationsverfahrens beschreibt die Ähnlichkeit der Mengen gewählter Variablen, wenn das Verfahren auf mehreren ähnlichen Trainingsdatensätzen angepasst wird. Um für konkrete Trainingsdaten solche Klassifikationsregeln zu erhalten, die nicht nur eine hohe Klassifikationsgüte aufweisen, sondern auch eine stabile Auswahl einer geringen Anzahl an Variablen durchführen, werden alle drei Zielkriterien bereits beim Parametertuning berücksichtigt. In dieser Arbeit werden mehrere Ansätze dafür vorgestellt und verglichen. Zudem erfolgt ein ausführlicher Vergleich verschiedener Stabilitätsmaße.Item Auswirkungen von Prävalenzänderungen in einem stark restringierten Regressionsmodell(2016-03-29) Djeudeu Deudjui, Dany Armand; Ickstadt, Katja; Ickstadt, KatjaStatistische Methoden werden in vielen Studien eingesetzt, um Zusammenhänge von Variablen zu erklären. In mehreren Anwendungen der Regressionsanalyse ändern sich die Regressoren bei den Messungen oder im Lauf der Zeit. Zur Berechnung der sog. Morbiditätsveränderungsrate der gesetzlich Versicherten in Deutschland wird ein Kompressionsalgorithmus benutzt. Innerhalb des Kompressionsalgorithmus werden mehrere vorläufige und eine endgültige Regressionsrechnung zur Bestimmung der sog. Kostengewichte der Versicherten durchgeführt. Es handelt sich dabei jeweils um multiple, lineare Regressionsrechnungen mit dichotomen, unabhängigen Variablen ohne Intercept. Das Problem der Prävalenzänderungen entsteht dadurch, dass die Ärzte bei den gesetzlichen Versicherten die Krankheiten dokumentieren und es dabei von Jahr zu Jahr bzw. auch in unterschiedlichen Regionen (Bundesländer) unterschiedliche Entwicklungen gibt. Durch die Dokumentation der Krankheiten ändern sich von Jahr zu Jahr die Spalten der Regressormatrix, wenn sich die Prävalenzen der betrachteten Diagnosen ändern und die Auswirkungen auf Regressionskoeffzienten wird in dieser Arbeit untersucht. Besonders werden einige Eigenschaften des Verhaltens der Regressionskoeffizienten abgeleitet, wenn sich die Prävalenzen einzelner unabhängiger Variablen oder die Häufigkeiten des Auftretens einzelner Krankheitsgruppe ändern.Item Zusätzlicher Nutzen von ordinalen Proteinmessungen in prognostischen Modellen für Lungenkrebs(2016-03-15) Hilbert, Julia; Rahnenführer, Jörg; Rahnenführer, JörgItem Einfluss verschiedener Heterogenitätsschätzer in der Meta-Analyse mit binären Daten(2016-05-06) Stockhaus, Philipp; Knapp, Guido; Knapp, GuidoDie vorliegende Arbeit stellt zwei Modelle der Meta-Analyse vor. Zum einen das Modell mit festen und zum anderen das Modell mit zufälligen Effekten. Wobei das Modell mit festen Effekten nur von einer Variabilität innerhalb der Studien ausgeht, während das Modell mit zufälligen Effekten auch die Variabilität zwischen den einzelnen Studien betrachtet. Diese Variabilität wird durch den Heterogenitätsparameter angegeben und kann mithilfe eines Heterogenitätsschätzers geschätzt werden. Weiterhin ist es möglich ein Konfidenzintervall für den Heterogenitätsparameter zu schätzen. In dieser Arbeit soll nun mithilfe einer Simulationsstudie untersucht werden wie sich die Grenzen des Q-Profile Intervalls, welches ein Konfidenzintervall für den Heterogenitätsparameter darstellt, als Heterogenitätsschätzer verhalten.Item Analyse von Metabolom-Daten der Arzneipflanze Duboisia: Hauptkomponentenanalyse, Clusterung und Peakidentifizierung(2015-12-18) Horn, Simon; Ickstadt, Katja; Ickstadt, Katja; Kayser, OliverMedikamente auf pflanzlicher Basis liegen im Trend und bergen ein großes Potenzial. Um dieses jedoch voll ausschöpfen zu können, sind genaue Analysen der Metabolit-Zusammensetzungen dieser Arzneipflanzen vonnöten. Diesbezüglich werden in dieser Abschlussarbeit die NMR-Daten (Nuclear magnetic resonance) von verschiedenen Typen der Arzneipflanze Duboisia verglichen und analysiert. Mithilfe einer Clusteranalyse wird untersucht, ob und nach welchen Kriterien verschiedene Varianten dieser Pflanze gruppiert werden können. Zudem werden zwei Verfahren zur Entschlüsselung der Metabolit-Zusammensetzungen erprobt und verglichen.Item A Simulation Study to Compare Methods for Subgroup Identification and Subgroup Effect Inference in Clinical Trials(2015-11-03) Thomas, Marius; Ickstadt, Katja; Ickstadt, Katja; Bornkamp, BjörnIdentifying subgroups, which respond differently to a treatment, both in terms of efficacy and safety, is an important part of drug development. In early phase exploratory clinical trials the well-known challenges of subgroup analyses, like multiplicity and lack of power, are further amplified by the low sample size and because relatively limited clinical prior information on the drug is available. In this thesis some novel strategies for subgroup identification and treatment effect estimation in selected subgroups are compared in a simulation study motivated by real clinical trial situations.Item Statistische Evaluierung der DESeq-Methode zur Bestimmung differentieller Genexpression in einer Lungenkrebskohorte(2015-08-21) Cyris, Christina; Rahnenführer, Jörg; Rahnenführer, Jörg; Ligges, UweItem Statistische Modellierung von Dosis-Expressionskurven für einzelne Gene und für Gengruppen(2015-11-10) Mentenich, Nicole; Rahnenführer, Jörg; Rahnenführer, Jörg; Kopp-Schneider, AnnetteDer Ausdruck der Dosis-Expressionskurve leitet sich her von dem Begriff der Dosis-Wirkungskurven: Mit Microarray-Chips erhobene Genexpressionswerte werden in Abhängigkeit von der Konzentration einer zugegebenen Chemikalie durch eine log-logistische Funktion modelliert. Aus der Modellkurve kann anschließend die sogenannte ALEC als Konzentration zu einem vorgegebenen Effekt-Level berechnet werden. Dies dient der Aufdeckung von Konzentrationen mit differentieller Genexpression. Um über die Aktivierung von gesamten Gengruppen zu bestimmten biologischen Prozessen entscheiden zu können, sollen diese ALEC-Werte zudem mit einem Mixed-Effects Modell oder einer Meta-Analyse zusammengefasst werden. Anhand eines konkreten Datensatzes werden diese Methoden erprobten induktiven Verfahren gegenübergestellt, der Limma-Methode auf Genebene und der Enrichment-Analyse auf Ebene der Gengruppen: Das log-logistische Modell liefert im Gegensatz zu Limma stetig messbare ALEC-Schätzer und erkennt einen Effekt daher bei einer guten Modellanpassung tendenziell früher. Eine Zusammenfassung der ALEC-Werte über Gengruppen kann allerdings nur für solche Gene erfolgen, bei denen der vorgegebene Effekt festgestellt wird. Somit berücksichtigt die zusammenfassende Modellierung nur einen meist geringen Anteil der Gengruppe, weswegen sie höchstens in Spezialfällen oder ergänzend zur Enrichment-Analyse herangezogen werden sollte.Item Methodenvergleich zur Nutzenbewertung anhand indirekter Vergleiche in klinischen Studien(2015-11-06) Kühnast, Sarah; Rahnenführer, Jörg; Leverkus, Friedhelm; Rahnenführer, JörgItem Auswahl von Patientenkohorten für Metaanalysen(2015-12-02) Nguyen, Quynh Lan; Rahnenführer, Jörg; Rahnenführer, Jörg; Knapp, GuidoItem Ungleiche a priori Wahrscheinlichkeiten in linearen Diskriminanzanalyseverfahren(2015-12-23) van Meegen, Carmen; Ligges, Uwe; Ligges, Uwe; Weihs, ClausDer Umgang mit ungleichen a priori Wahrscheinlichkeiten in linearen Diskriminanzanalyseverfahren ist in der Literatur kaum beschrieben und zum Teil widersprüchlich formuliert. In dieser Arbeit werden speziell die Diskriminanzanalyse basierend auf der Gaußverteilung (GDA) und die Diskriminanzanalyse nach Fisher (FDA) betrachtet. Es wird die Einbindung von ungleichen a priori Wahrscheinlichkeiten sowohl in Diskriminanzregeln als auch in verschiedene Schätzer der beiden Verfahren untersucht. Zudem wird gezeigt, dass GDA und FDA bei einer beliebigen Anzahl an Gruppen und Merkmalen und auch unterschiedlichen a priori Wahrscheinlichkeiten zu den selben Ergebnissen führen. Die in der Theorie bewiesenen Resultate werden mit Hilfe kleiner Simulationsstudien für zwei und drei Klassen verdeutlicht.Item Vergleich verschiedener nichtlinearer Modelle für die Prognose von Risswachstum(2015-05-06) Wolff, Frieder; Müller, Christine; Ickstadt, KatjaThema dieser Arbeit ist die Anpassung und Prognose von Risswachstum mit verschiedenen Modellen. Brauchbare Prognosen von Risswachstum, können beispielsweise genutzt werden um zu entscheiden, wann Brücken saniert oder Verschleißteile diverser Maschinen ersetzt werden müssen. Dieser Arbeit liegt ein Datensatz von Virkler et al. zu Grunde, der 68 künstlich erzeugte Risse beinhaltet. In der statistischen Auswertung wird untersucht, mit welchen Modellen sich die beobachteten Risse am besten beschreiben lassen. Dafür werden drei Modelle aus der Paris-Erdogan Gleichung hergeleitet. Des Weiteren wird ein allgemeiner Modellierungsansatz mit je einer von vier klassischen Wachstumsfunktionen verwendet. Für alle Modelle, mit denen gute Anpassungenerzielt werden können, werden außerdem Prognosen samt zugehöriger Intervalle berechnet und miteinander verglichen.Item Erweiterung der Plattform OpenML um Ereigniszeitanalysen(2015-03-30) Kirchhoff, Dominik; Rahnenführer, Jörg; Bischl, BerndIm Rahmen der vorliegenden Arbeit wird der Aufgabentyp der Ereigniszeit- bzw. Überlebenszeitanalyse zur Plattform OpenML hinzugefügt. Bei OpenML handelt es sich um eine Online-Datenbank, bei der Datensätze, Lernverfahren des maschinellen Lernens sowie die zugehörigen Ergebnisse in einer strukturierten Form hochgeladen, gespeichert und abgerufen werden können. Da dort bisher hauptsächlich Klassifikations- und Regressionsprobleme berücksichtigt wurden, eröffnet die Anbindung von Ereigniszeitanalysen den Benutzern einen weiteren großen Teilbereich des maschinellen Lernens. In der Arbeit wird beschrieben, wie bei der Erweiterung vorgegangen wurde und zeigt beispielhaft anhand kleiner Studien einige Vorteile, die die Benutzung der Plattform OpenML und des gleichnamigen R-Pakets mit sich bringen.Item Statistische Analyse von Onlinepokerdaten(2015-07-08) Schmieder, Marc; Arnold, Matthias; Wied, DominikDer Onlinepokermarkt gehört zu den Neuerscheinungen des Internets, in dem das Sammeln, Auswerten und Analysieren von Daten eine zentrale Rolle spielt. Diese Bachelorarbeit thematisiert die Auswertung von Online- und Livespielerdaten anhand gezielter Fragestellungen. Unter Anwendung einer Clusteranalyse werden Spielergruppen gebildet, die sich bezüglich der Spielstärke und Strategie voneinander unterscheiden. Es folgt ein Vergleich der jährlich realisierten Gewinne von professionellen Live- und Onlinespielern bezüglich Erwartungswert und Varianz. Ergänzend werden, abhängig von Spielvolumen und Geldeinsatz, eine Reihe von Prognosen des zu realisierenden Gewinns erstellt.