Præsentation af dataanalyse

Dataanalyse og
tabulering/pivotering af dine data

Forstå dit data og lav den rigtige analyse

Opbyg en statistisk model i R

Modelreduktion

Modelantagelser

Øvelse 3
Forstå data og lav den rigtige analyse
Forstå dit data…

Spørgsmål du skal overveje inden din analyse går i gang:
– Hvilken variabel i dit datasæt er responsvariablen?
– Hvilken klasse har responsvariablen?
• Numerisk, kategorisk, en tællevariabel, en proportion,…?
– Hvilken klasse har de forklarende variable?
• Numeriske, kategoriske, måske en blanding?

Bemærk: I dag arbejder vi med numeriske responsvariable
… og lav den rigtige analyse!

Numerisk responsvariabel og normalfordelte residualer
 Regressionsanalyse, ANOVA eller ANCOVA
Desuden:

Kun numeriske forklarende variable
 Regressionsanalyse

Kun kategoriske forklarende variable
 ANOVA (Analysis Of Variance)

Både kontinuerte og kategoriske forklarende variable
 ANCOVA (Analysis Of Covariance)

I alle disse tilfælde benyttes funktionen lm() i R
Generalized
Linear
Models
Opbyg en statistisk model i R
Modelkonstruktion i R

Modelstruktur i R
responsvariabel ~ forklarende variable

Symbolet ”~” læses: modelleres som en funktion af

I modelopbygningen gælder
+
*
:
En
En
En
En
forklarende variabel tilføjes modellen
forklarende variabel fjernes fra modellen
forklarende variabel og interaktion tilføjes modellen
interaktion tilføjes modellen
Modelkonstruktion i R (fortsat)

Eksempel 1: Ækvivalente modelopskrivninger
y ~ A + B + C + A:B + A:C + B:C + A:B:C
y ~ A*B*C
y ~ (A + B + C)^3

Eksempel 2: Ækvivalente modelopskrivninger
y ~ A + B + C + A:B + A:C + B:C
y ~ A*B*C – A:B:C
y ~ (A + B + C)^2
Modelreduktion
Find den minimale og tilstrækkelige model

Der er sandsynligvis mange modeller der kan beskrive dit data

Målet er at finde den minimale og tilstrækkelige model
– Modellen er minimal
Alle termer i modellen er signifikante
– Modellen er tilstrækkelig
Modellen beskriver en signifikant del af variationen i responsvariablen

Reducér startmodellen: Fjern ikke-signifikante termer ét ad gangen

Medtag kun en forklarende variabel i din model, hvis det
resulterer i et signifikant bedre modelfit end at beholde den

Se på ANOVA-tabeller med funktionen anova()
Modelantagelser
Test modelantagelserne

Normalfordelte residualer
qqnorm()
shapiro.test()
Test modelantagelserne (fortsat)

Uafhængighed mellem
varians og middelværdi
plot(residuals ~ fitted)

Varianshomogenitet
plot(residuals ~ blok)
bartlett.test(residuals ~ blok)
Øvelse 3
Øvelse 3

Analyse af datasættet fra øvelse 2

Opbygge en model

Lave modelkontrol

Fortolke de estimerede effekter