Dataanalyse og tabulering/pivotering af dine data Forstå dit data og lav den rigtige analyse Opbyg en statistisk model i R Modelreduktion Modelantagelser Øvelse 3 Forstå data og lav den rigtige analyse Forstå dit data… Spørgsmål du skal overveje inden din analyse går i gang: – Hvilken variabel i dit datasæt er responsvariablen? – Hvilken klasse har responsvariablen? • Numerisk, kategorisk, en tællevariabel, en proportion,…? – Hvilken klasse har de forklarende variable? • Numeriske, kategoriske, måske en blanding? Bemærk: I dag arbejder vi med numeriske responsvariable … og lav den rigtige analyse! Numerisk responsvariabel og normalfordelte residualer Regressionsanalyse, ANOVA eller ANCOVA Desuden: Kun numeriske forklarende variable Regressionsanalyse Kun kategoriske forklarende variable ANOVA (Analysis Of Variance) Både kontinuerte og kategoriske forklarende variable ANCOVA (Analysis Of Covariance) I alle disse tilfælde benyttes funktionen lm() i R Generalized Linear Models Opbyg en statistisk model i R Modelkonstruktion i R Modelstruktur i R responsvariabel ~ forklarende variable Symbolet ”~” læses: modelleres som en funktion af I modelopbygningen gælder + * : En En En En forklarende variabel tilføjes modellen forklarende variabel fjernes fra modellen forklarende variabel og interaktion tilføjes modellen interaktion tilføjes modellen Modelkonstruktion i R (fortsat) Eksempel 1: Ækvivalente modelopskrivninger y ~ A + B + C + A:B + A:C + B:C + A:B:C y ~ A*B*C y ~ (A + B + C)^3 Eksempel 2: Ækvivalente modelopskrivninger y ~ A + B + C + A:B + A:C + B:C y ~ A*B*C – A:B:C y ~ (A + B + C)^2 Modelreduktion Find den minimale og tilstrækkelige model Der er sandsynligvis mange modeller der kan beskrive dit data Målet er at finde den minimale og tilstrækkelige model – Modellen er minimal Alle termer i modellen er signifikante – Modellen er tilstrækkelig Modellen beskriver en signifikant del af variationen i responsvariablen Reducér startmodellen: Fjern ikke-signifikante termer ét ad gangen Medtag kun en forklarende variabel i din model, hvis det resulterer i et signifikant bedre modelfit end at beholde den Se på ANOVA-tabeller med funktionen anova() Modelantagelser Test modelantagelserne Normalfordelte residualer qqnorm() shapiro.test() Test modelantagelserne (fortsat) Uafhængighed mellem varians og middelværdi plot(residuals ~ fitted) Varianshomogenitet plot(residuals ~ blok) bartlett.test(residuals ~ blok) Øvelse 3 Øvelse 3 Analyse af datasættet fra øvelse 2 Opbygge en model Lave modelkontrol Fortolke de estimerede effekter
© Copyright 2024