Autor(en): Topp, Rebekka
Titel: Regression and residual analysis in linear models with interval censored data
Sprache (ISO): en
Zusammenfassung: Meine Arbeit besteht aus zwei Teilen, die beide mit der Regressionsanalyse im Zusammenhang mit intervallzensierten Daten zu tun haben. Intervallzensierte Daten x sind solche Daten, die man nicht genau beobachten kann, sondern nur deren Intervalle [xL,xR], die mit Wahrscheinlichkeit 1 den wahren Wert von x enthalten.Im ersten Teil entwickle ich eine Schätztheorie für die Regressionsparameter im linearen Modell, wenn sowohl die abhängige als auch die unabhängige Variable intervallzensiert ist. Dabei benutze ich einen semiparametrischen Maximum Likelihood Ansatz, der die Schätzer für die Regressionsparameter durch die Maximierung der Likelihood Funktion bestimmt. Das Problem, das hierbei in meinem Kontext auftritt ist, dass die bei der Likelihoodmaximierung benötigte Dichtefunktion der Kovariante durch die Intervallzensierung nicht bekannt ist. Deswegen löse ich das Maximierungsproblem mit einem Algorithmus, der gleichzeitig die unbekannte Dichte der Kovariante bestimmt, und danach die dann vollständig bestimmte Likelihoodfunktion maximiert. Die Bestimmung der Kovariantendichte ist eine Modifikation des Ansatzes von Turnbull (1976), der eine nichtparametrische Schätztheorie vorschlägt. Die Maximierung der Likelihoodfunktion erfolgt dann wie normal durch Nullsetzen der Scorefunktion. Ich berechne die resultierenden Parameterschätzer für die Fälle, dass der Fehlerterm aus einer Verteilung der Exponentialfamilie oder der Weibullverteilung stammt. Ausserdem erweitere ich die Schätztheorie für den Fall, dass man ausser der intervallzensierten Kovariate noch zusätzlich einen unzensierten Kovariatenvektor im Modell hat. Da theoretische statistische Eigenschaften für die Schätzer nur schwer hergeleitet werden können, habe ich Simulationen durchgeführt, um die Güte der Schätzer bestimmen zu können. Für die gewählten Simulationsszenarien waren die mit meiner Methode geschätzten Werte für die Regressionsparameter immer sehr nah an den wahren Werten. Abschließend diskutiere ich noch zwei alternative Schätzmethoden für dieses Regressionsproblem.Im zweiten Teil meiner Arbeit beschäftige ich mich mit der Residualanalyse im linearen Modell wenn nur die Kovariante intervallzensiert ist, die abhängige Variable aber unzensiert ist. In diesem Fall stellt sich heraus, dass die zugehörigen Fehler des Modells, und damit auch die Residuen, intervallzensiert sind, und es tritt das Problem auf, dass die Residuen nicht direkt beobachtbar sind. Mein Ansatz zur Lösung dieses Problem ist der folgende: Da die Modellannahme N(0,s2)-verteilte Fehler vorsieht, ist die Verteilung der hier intervallzensierten Fehler eine durch das Fehlerintervall gestutzte Normalverteilung. Entsprechend ist die Verteilung der Residuen die -Verteilung gestutzt im zugehörigen Residualintervall. Die Fehlervarianz schätze ich dabei mit der Methode von Gómez et al. (2002). In einer Simulationsstudie vergleiche ich das Verhalten der so konstruierten Residuen mit dem der Residuen von Gómez et al. (2002) und einem naiven Typ von Residuen, die den Intervallmittelpunkt als das beobachtete Residuum annehmen. Dabei untersuche ich deren Verhalten sowohl im korrekt spezifizierten Modell, als auch für Fälle, in denen Modellverletzungen, wie zum Beispiel nichtkonstante Fehlervarianz oder eine falsch spezifizierte Regressionsgleichung, vorliegen. Die Resultate zeigen, dass meine Residuen in den meisten Szenarien für die Modellevaluierung benutzt werden könne, während das bei den anderen beiden Resiudaltypen nicht der Fall ist. Zum Schluß wende ich meine Residualtheorie auf einen Datensatz einer klinischen Studie an.
Schlagwörter: regression
interval censoring
residuals
URI: http://hdl.handle.net/2003/2774
http://dx.doi.org/10.17877/DE290R-390
Erscheinungsdatum: 2002-07-22
Provinienz: Universität Dortmund
Enthalten in den Sammlungen:Lehrstuhl Mathematische Statistik und biometrische Anwendungen

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat 
Allintro.ps437.89 kBPostscriptÖffnen/Anzeigen
resintro.ps2.83 MBPostscriptÖffnen/Anzeigen
toppgesunt.pdfDNB1.27 MBAdobe PDFÖffnen/Anzeigen


Diese Ressource ist urheberrechtlich geschützt.



Diese Ressource ist urheberrechtlich geschützt. rightsstatements.org