Autor(en): Rempel, Eugen
Titel: Statistische Analyse von hochdimensionalen toxikologischen Expressionsdaten
Sprache (ISO): de
Zusammenfassung: Hochdurchsatz-Technologien spielen eine immer größer werdende Rolle in der biologischmedizinischen Forschung. Sie erlauben eine gleichzeitige Messung von Tausenden von biologisch relevanten Messgrößen. So lassen sich zum Beispiel die Expressionen mehrerer Gene mit Hilfe des Microarray-Chips des Herstellers Affymetrix gleichzeitig bestimmen. Die Aufbereitung, Analyse und Interpretation dieser Daten stellen die Wissenschaft jedoch vor vielen Herausforderungen. In der vorliegenden Arbeit nahm man sich zum Ziel, eine Abfolge von statistischen Methoden und Verfahren bereitzustellen, welches dem Anwender ermöglicht, Microarray-Daten sequentiell zu untersuchen. Dazu gehören sowohl deskriptive als auch induktive Analysen. In dieser Arbeit wurde die vorgestellte Verfahrenabfolge ("Pipeline") auf Daten ausgewertet, welche im Rahmen der Toxizitätsstudien erhoben wurden. Die Analysen der zellulären Reaktion sowohl auf steigende Konzentration ("Konzentrationsstudien") als auch auf verschiedene Typen von Substanzen ("Klassifikationsstudien") standen dabei im Vordergrund. Im ersten Schritt wurden die Daten mit Hilfe der Hauptkomponenten- bzw. Clusteranalyse graphisch visualisiert. Dies erlaubte erste Eindrücke bezüglich Datenqualität zu gewinnen. In nächsten Schritten wurden die unterschiedlich exprimierte Gene bestimmt, welche den dynamischen Veränderungen innerhalb der Zelle zu Grunde liegen. Diese "Momentaufnahmen"lassen sich auf Anreicherung innerhalb bekannter biologischer Signaturen testen und somit erste Schlüsse auf zelluläre Prozesse erhalten. Mögliche Quellen der nicht-biologischen Varianz lassen sich mit Hilfe des erörterten ComBat-Verfahrens reduzieren. Bei der Auswertung von Klassifikationsstudien wurden folgende Ergebnisse festgestellt: - Eine Vorauswahl von Prädiktoren erlaubt eine biologische Interpretation und ermöglicht eine sinnvolle Einteilung von Substanzen. Die Klassifikationsgüte wurde dabei im Rahmen einer Kreuzvalidierung bestimmt und auf einem externen Datensatz bestätigt. - Anzahl der technischen Replikate darf zu Gunsten der Vergrößerung der Substanzenanzahl verkleinert werten. - Die analysierten Verfahren zeigen sich gegenüber dem hinzugefügten Rauschen robust. Die gewonnenen Ergebnisse sind teilweise in referierten Zeitschriften veröffentlicht worden.
Schlagwörter: Klassifikation
Toxikologie
Hochdurchsatztechnologie
Affymetrix
Schlagwörter (RSWK): Klassifikation
Support-Vektor-Maschine
Random Forest
Toxikologische Bewertung
Hochdurchsatzsequenzierung
URI: http://hdl.handle.net/2003/35296
http://dx.doi.org/10.17877/DE290R-17339
Erscheinungsdatum: 2016
Enthalten in den Sammlungen:Statistische Methoden in der Genetik und Chemometrie

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat 
Dissertation_Rempel.pdfDNB17.2 MBAdobe PDFÖffnen/Anzeigen


Diese Ressource ist urheberrechtlich geschützt.



Diese Ressource ist urheberrechtlich geschützt. rightsstatements.org