Authors: Rempel, Eugen
Title: Statistische Analyse von hochdimensionalen toxikologischen Expressionsdaten
Language (ISO): de
Abstract: Hochdurchsatz-Technologien spielen eine immer größer werdende Rolle in der biologischmedizinischen Forschung. Sie erlauben eine gleichzeitige Messung von Tausenden von biologisch relevanten Messgrößen. So lassen sich zum Beispiel die Expressionen mehrerer Gene mit Hilfe des Microarray-Chips des Herstellers Affymetrix gleichzeitig bestimmen. Die Aufbereitung, Analyse und Interpretation dieser Daten stellen die Wissenschaft jedoch vor vielen Herausforderungen. In der vorliegenden Arbeit nahm man sich zum Ziel, eine Abfolge von statistischen Methoden und Verfahren bereitzustellen, welches dem Anwender ermöglicht, Microarray-Daten sequentiell zu untersuchen. Dazu gehören sowohl deskriptive als auch induktive Analysen. In dieser Arbeit wurde die vorgestellte Verfahrenabfolge ("Pipeline") auf Daten ausgewertet, welche im Rahmen der Toxizitätsstudien erhoben wurden. Die Analysen der zellulären Reaktion sowohl auf steigende Konzentration ("Konzentrationsstudien") als auch auf verschiedene Typen von Substanzen ("Klassifikationsstudien") standen dabei im Vordergrund. Im ersten Schritt wurden die Daten mit Hilfe der Hauptkomponenten- bzw. Clusteranalyse graphisch visualisiert. Dies erlaubte erste Eindrücke bezüglich Datenqualität zu gewinnen. In nächsten Schritten wurden die unterschiedlich exprimierte Gene bestimmt, welche den dynamischen Veränderungen innerhalb der Zelle zu Grunde liegen. Diese "Momentaufnahmen"lassen sich auf Anreicherung innerhalb bekannter biologischer Signaturen testen und somit erste Schlüsse auf zelluläre Prozesse erhalten. Mögliche Quellen der nicht-biologischen Varianz lassen sich mit Hilfe des erörterten ComBat-Verfahrens reduzieren. Bei der Auswertung von Klassifikationsstudien wurden folgende Ergebnisse festgestellt: - Eine Vorauswahl von Prädiktoren erlaubt eine biologische Interpretation und ermöglicht eine sinnvolle Einteilung von Substanzen. Die Klassifikationsgüte wurde dabei im Rahmen einer Kreuzvalidierung bestimmt und auf einem externen Datensatz bestätigt. - Anzahl der technischen Replikate darf zu Gunsten der Vergrößerung der Substanzenanzahl verkleinert werten. - Die analysierten Verfahren zeigen sich gegenüber dem hinzugefügten Rauschen robust. Die gewonnenen Ergebnisse sind teilweise in referierten Zeitschriften veröffentlicht worden.
Subject Headings: Klassifikation
Toxikologie
Hochdurchsatztechnologie
Affymetrix
Subject Headings (RSWK): Klassifikation
Support-Vektor-Maschine
Random Forest
Toxikologische Bewertung
Hochdurchsatzsequenzierung
URI: http://hdl.handle.net/2003/35296
http://dx.doi.org/10.17877/DE290R-17339
Issue Date: 2016
Appears in Collections:Statistische Methoden in der Genetik und Chemometrie

Files in This Item:
File Description SizeFormat 
Dissertation_Rempel.pdfDNB17.2 MBAdobe PDFView/Open


This item is protected by original copyright



All resources in the repository are protected by copyright.