2015-11-04 Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik Urvalsstorlek Mätnivå/skaltyp Fördelning av data Studiedesign Frida Eek [email protected] 1 2 Studiedesign En grupp (jämfört med referensvärde, eller 0)? Samples size: Stort eller litet urval? Två (eller flera) grupper –tvärsnittsjämförelse? Oberoende -unpaired (independent) samples/ observations Fördelning: Normalfördelat eller snedfördelat? (Symmetriskt eller assymmetriskt) Upprepade mätningar-två (eller flera) mätningar på samma individer? Beroende –paired (dependent) samples/ observations 3 4 Variablernas mät/skalnivå Samples size: Stort eller litet urval? Fördelning: Normalfördelat eller snedfördelat? (Symmetriskt eller assymetriskt) 5 Kategorisk? Binär? Ordinalskala? Metrisk/scale? Kombinationen av oberoende och beroende variabel (exponering och utfall) avgör test! 6 1 2015-11-04 Parametriska test: Dimensioner att beakta Förutsätter normalfördelning Stora urval/sample Ger både p-värde och effektmått Tex t-test, ANOVA, pearson correlation 7 Test-karta Icke-parametriska test Kräver ej normalfördelning Små sample OK Ger p-värden Ex Mann-whitney, spearman correlation 8 9 10 Situation 1: Några vanliga test 2 grupper av möss: albino och icke-albino Hur många har en specifik genetisk mutation? Vilket är IV resp DV? Vilken typ av variabler (mätnivå) är de? 11 12 2 2015-11-04 Chi2-test Chitvå (Chi2) setting Två kategoriska variabler (binär, nominal eller ordinal med relativt få kategorier) Icke-parametriskt test Testar om frekvensen (andelen) av utfallet är den samma mellan olika grupper (jämför observerade och förväntade frekvenser) 2 grupper av möss: albino eller icke-albino Hur många har en specifik gen-mutation? IV: DV: Oberoende mätningar Ger p-värde Talar inte om exakt vilka ”celler” som skiljer sig åt, endast att fördelningen inte är den samma i alla jämförda grupper. 13 14 15 16 Chitvå (Chi2) Presentera resultat från Chi-två 17 P-värde Deskriptivt: frekvens/andelsfördelning 18 3 2015-11-04 Situation 2: T-test 2 grupper: normal diet och restricted caloriesdiet Hur länge lever de? (Hur gamla blir de?) Vilket är IV resp DV? Vilken typ av variabler är de? Parametriskt test Jämför två medelvärden Tvärsnitt (oberoende mätningar) eller upprepade mätningar (före-efter) – olika t-test! Independent- eller paired- samples) Ger p-value Ger medelvärdesskillnad och CI Nackdel: går ej att justera för potentiella confounders. Jämför endast två grupper/mättillfällen. 19 20 Independent sample t-test: Två oberoende grupper – 2 grupper: normal diet och restricted calories Skillnad i livslängd? Punktskattningen IV DV Man kan räkna ut ett konfidensintervall för skillnad i medelvärde SEpooled är ett sammanviktat standardfel s2pooled är en sammanviktad varians KI ( x A x B ) c SE pooled 1 1 SE pooled s 2pooled n A nB s 2pooled n A 1 s A2 nB 1 s B2 n A 1 nB 1 (n = antal observationer; x = medelvärde; s = standardavvikelse) 21 22 Antaganden bakom t-testet (independent sample t-test) Två versioner av t-testet beroende på om man kan anta att standardavvikelsen är lika i båda grupperna 1. Medelvärdet är ett bra sammanfattande mått 2. Oberoende observationer (t.ex. ingen patient förekommer mer än en gång) –om beroende mätningar/grupper används paired sample t-test! 3. Mätningarna är normalfördelade i båda grupperna eller Båda grupperna är stora Levene’s test: p-värde (”Sig.”) testar H0: Varians i A = Varians i B 23 24 4 2015-11-04 Situation 3: Paired sample t-test 1 1 grupp: före och efter anabola steroider Förändring i styrka? (tyngdlyftningstest) Förändring i uthållighet? 1 grupp –pre och post Metric/scale outcome. Normalfördelad (differens)? 25 Paired sample t-test 2: endurance (min in wheel) 26 Presentera resultat från t-test (paired och/eller independent samples) Medelvärdesskillnader med CI P-värde? 27 28 Situation 4: Antaganden bakom parat t-test 1. Parade stickprov, beroende inom paren, inget beroende mellan paren 2. Medelvärde är ett relevant summerande mått: H0: Medelvärdesskillnaden = 0 3 groups: Normaldiet, restricted cal, LCHF Skillnad i livslängd? DV/IV? Variabeltyper/mätnivå? 3. Skillnaderna mellan paren är normalfördelade eller Det finns så många par att det inte gör något att de inte är normalfördelade 29 30 5 2015-11-04 ANOVA (ANalysis Of VAriance) ANOVA: Parametriskt test Jämför medelvärden mellan 2 eller flera grupper (egentligen, varians inom/mellan grupperna!) Tvärsnittsjämförelse/oberoende mätningar (”vanlig” ANOVA) eller upprepade mätningar (repeated measures ANOVA) Ger p-value Parvisa post hoc test-möjligheter Ger medelvärden med CI Möjligt att inkludera flera olika IV/covariat –justera för confounders Möjligt atth testa interaktioner (effect modification) (ANCOVA, MANOVA..) 3 grupper: Normal diet, restricted cal, LCHF Skillnad i livslängd? IV: 31 ANOVA 32 Post-hoc test 33 När ska icke-parametriska test användas? 34 Icke-parametriska gruppjämförelser Icke-parametriska test används när förutsättningarna för parametriska test inte uppfylls. Vid små urval, eller skeva fördelningar (eller ordinal(?)/nominaldata) DV: Då används icke-parametriska test. De ställer inte samma krav på normalfördelning, mätnivå etc. 35 T ex Mann-whitney, Wilcoxon, McNemar, Kruskal Wallis, Friedmans ANOVA… Modellen anges i SPSS (antal grupper, paired eller independent samples, etc). SPSS kan välja exakt test –men det är såklart bra att veta vad som händer! Ger p-värde Jämförelser baseras generellt på rangordning istället för exakta värden 36 6 2015-11-04 Mann-Whitneys U test Situation: 8 albinoråttor och 8 icke-albinoråttor Skillnad i serum vitamin D? (ng/mL) IV/DV? Små grupper, och/eller assymmetriska data Rangordna alla observationerna från den lägsta till den högsta Beräkna summan av rangerna i grupp A (W A) respektive grupp B (W B) Ju större skillnad i medelrang, W A/nA och W B/nB, ju lägre p-värde fås 37 Mann-whitney U 38 Presentera resultat från Mann-Whitney U test Deskriptiv statistik för de två grupperna Median Min och Max (eller lämpliga percentiler) P-värde Mediankonfidensintervall finns men används inte så ofta 39 Situation: 40 Parade data Icke-parametriskt test 8 möss, före och efter vitamin D tillskott Förändring i serum vitamin D? IV/DV? 41 Wilcoxons teckenrangtest H0: Mediandifferenserna mellan metoderna är noll, och positiva och negativa differenser har samma fördelning H1: Mediandifferenserna mellan metoderna är inte noll, eller positiva och negativa differenser har inte samma fördelning 42 7 2015-11-04 Wilcoxon signed rank Fler icke-parametriska gruppjämförelser: Tvärsnittsjämförelse av mer än 2 grupper: KurskalWallis (med post-hoc) Samma logik som för Mann-whitney U Binär/dikotom (yes/no) variabel, upprepade mätningar (t ex andelen av ”någonting” före och efter en intervention): McNemar Vad du primärt får ut: p-värden. 43 Situation: 44 Association? 32 möss, olika solljusexponering. Olika nivåer av serum vitamin D Finns det något samband mellan solljusexponering och vitamin D-nivåer? Vilken typ av variabler? 45 Korrelation 46 Korrelation Parametrisk (pearson) eller icke-parametrisk (spearman) Beskriver association (linjär samvariation) mellan två metriska variabler Ger p-värde Ger korrelationskoefficient ( r ) (Ger därmed även förklarad varians (r2)) 47 Parametrisk (baserad på faktiska värden) eller icke-parametrisk (baserad på rangordning)? 48 8 2015-11-04 Presentera resultat från korrelation? Linjär regression r, eller rho p-value r2? Om man antar att en variabel påverkar den andra, kan sambandet beskrivas genom linjär regression (OBS regressionen kan dock aldrig vare sig testa eller bevisa faktisk kausalitet) Om y alltid är samma som x kan man säga att y = x Om y alltid är dubbelt så mycket som x kan man säga y = 2x y är beroende variabel x är oberoende variabel 49 Linear regression Linjär regression – formel 1 y = bx β är lutningen, ”the slope” Tolkningen av b är: 50 För varje enhet ökning i x, ökar y med b enheter En individ med en enhet högre x, har b enheter högre (predicted) y β (beta) är standardiserad slope: för en sd ökning i x, ökar y med β sd β/b can kan vara negativ = y minskar för varje ökning i x Y=a + bx –inkluderar intercept (a) 51 Parametriskt test Testar linjärt samband mellan två metriska/scale variabler eller en binär (oberoende/IV) och en metrisk/scale variabel (som beroende/DV) Y= a + bx Ger p-värde Ger regressions coefficient ( b/β ) Ger förklarad varians (r2) Flera prediktorvariabler/IV kan inkluderas (multipel linjär regression), ökar förklarad varians/förbättrar prediktion Tolkas som kausal påverkan från x på y, men bevisar ingen kausalitet! 52 Linjär regression – Ex: Marathon och VO2 Påverkar VO2max marathon-tid? Marathontid = dependent/beroende variabel (den som påverkas) = y VO2max= independent /oberoende variabel (den som påverkar) = x 53 54 9 2015-11-04 Variation Y=a + bx Linjär regression ger y = 414-4.46x Vad säger interceptet? ”Vad är y, när x=0” –där linjen skär y-axeln Negativ association= nät X ökar, så minskar y! If VO2max increases with 1 ml/kg/min, then marathon finishing time decreases with 4.5 minutes b= -4.46 95% CI:-4,91; -4,02 55 Line with best fit 56 Variation – goodness of fit Ju bättre modell, desto mindre residualer Den andel av variansen som förklaras av modellen: (R2) Ju fler förklarande variabler(factors) i modellen, desto högre R2 57 58 59 VO2max förklarar 45% av variationen I marathontid (obs! Fiktivt exempel) 55% är fortfarande oförklarat! Viss andel av variansen kommer alltid att förbli oförklarad (individuella variationer). Modellen kan dock förbättras genom inkludering av fler prediktiva/förklarande variabler! 60 10 2015-11-04 Presentera resultat från linjär regression Slope/b/beta-koefficient med CI Förklarad varians (Intercept?) 61 62 Linjär regression – villkor För varje värde på x måste y vara normalfördelad Samtliga observationer måste vara oberoende Variansen ska vara konstant Dessa villkor måste vallideras! AB 20111020 63 Modellvallidering Sammanfattning Residualerna ska vara 64 normalfördelade oberoende ha konstant varians Val av test avgörs genom att beakta: Variabeltyper (både beroende och oberoende) Studiedesign Urvalsstorlek Fördelning av (metrisk) data Detta undersöks med lämpliga figurer 65 66 11
© Copyright 2025