Clustermethoden für Massenspektren in proteomweiten statistischen Analysen

Rieder, Vera

Clustermethoden für Massenspektren in proteomweiten statistischen Analysen

dc.contributor.advisor	Rahnenführer, Jörg
dc.contributor.author	Rieder, Vera
dc.contributor.referee	Weihs, Claus
dc.date.accepted	2018-04-16
dc.date.accessioned	2018-04-19T09:14:15Z
dc.date.available	2018-04-19T09:14:15Z
dc.date.issued	2018
dc.description.abstract	Die Arbeit handelt von Clustermethoden für massenspektrometrische Analysen in der Biodiversitätsforschung. Alternativ zur Artenbestimmung mittels DNA-Barcoding wird die Analyse der Proteinzusammensetzung von Organismen verwendet. Die Mehrheit der Proteinanalytik basiert mittlerweile auf der sogenannten LC-MS/MS-Methode. Dabei wird eine Flüssigchromatographie (LC) als Trennmethode mit der Tandem-Massenspektrometrie (MS/MS) kombiniert. Tandem-Massenspektren, die aus detektierten Intensitäten von vorkommenden Massen bestehen, dienen zur Identifikation von Peptiden und Proteinen mittels Datenbanksuchalgorithmen. Neuartige unbekannte Peptide werden mittlerweile über fehleranfällige De-Novo-Peptidsequenzierungsalgorithmen detektiert. Alternativ zu Annotationsverfahren wird hier die direkte Clusteranalyse der Tandem-Massenspektren behandelt. Zwei Aspekte, die Clusteranalyse sogenannter Läufe, die tausende Spektren einer Proteinprobe umfasst, und die Clusteranalyse von einzelnen Tandem-Massenspektren werden untersucht. Eine Clusteranalyse sogenannter Läufe wird für mehrere reale Datensätze mithilfe der neuen Methode DISMS2 durchgeführt, die ohne Annotationen Distanzen zwischen MS/MS-Läufen bestimmt. Es handelt sich also um eine Alternative zum Vergleich von Peptidlisten, die auf der Identifikation von Spektren in Datenbanksuchen basieren. Die Parameter von DISMS2 sind frei wählbar, sodass die Auswahl der höchsten Peaks je Spektrum (topn), die Bingröße im Binning (bin), die Einschränkung bei dem Vergleich von Spektren auf zeitlich nahe Spektren (ret) mit ähnlicher Precursormasse (prec) und das Distanzmaß für Massenspektren (dist) mit einem frei wählbaren Schwellenwert (cdis) variieren. Zur Parameterwahl wird ein Vorgehen zur Optimierung angewandt, das das Bestimmtheitsmaß R2 eines nichtparametrischen Verfahrens zur Varianzanalyse verwendet. Zur Clusteranalyse von einzelnen Massenspektren wird ein bisher in der Literatur fehlender umfassender Vergleich von Algorithmen erstellt, die für Tandem-Massenspektren etabliert (CAST, MS-Cluster, PRIDE Cluster), für große Datensätze bekannt (hierarchische Clusteranalyse, DBSCAN, Zusammenhangskomponenten eines Graphen) oder neu (Neighbor Clustering) sind. Die Evaluierung basiert auf realen Daten und mehreren Gütemaßen.	de
dc.identifier.uri	http://hdl.handle.net/2003/36839
dc.identifier.uri	http://dx.doi.org/10.17877/DE290R-18840
dc.language.iso	de	de
dc.subject	Clusteranalyse	de
dc.subject	LC-MS/MS	de
dc.subject	Massenspektrometrie	de
dc.subject	Proteomik	de
dc.subject.ddc	310
dc.subject.rswk	Cluster-Analyse	de
dc.subject.rswk	LC-MS	de
dc.subject.rswk	Massenspektrometrie	de
dc.subject.rswk	Proteomanalyse	de
dc.title	Clustermethoden für Massenspektren in proteomweiten statistischen Analysen	de
dc.type	Text	de
dc.type.publicationtype	doctoralThesis	de
dcterms.accessRights	open access
eldorado.dnb.deposit	true	de
eldorado.secondarypublication	false	de

Files

Original bundle

Now showing 1 - 1 of 1

Name:: Dissertation_Rieder.pdf
Size:: 3.5 MB
Format:: Adobe Portable Document Format
Description:: DNB

Download

License bundle

Now showing 1 - 1 of 1

Name:: license.txt
Size:: 4.85 KB
Format:: Item-specific license agreed upon to submission
Description:

Download

Collections

Statistische Methoden in der Genetik und Chemometrie