Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation. Herefter blev der udtaget et eller flere æg samt (i princippet) to ægblærevæsker, en fra hver æggestok. Kvaliteten af de udtagne æg blev vurderet, og et antal hormoner blev målt i ægblærevæskerne, heriblandt testosteron (nmol/l) og InhibinB (ng/ml). For 4 kvinder lykkedes det ikke at opnå nogle æg eller ægblærer, og for visse af de 96 resterende var det (af forskellige årsager) ikke muligt at foretage alle hormonbestemmelserne. På hjemmesiden http://staff.pubhealth.ku.dk/~lts/basal13_1/hjemmeopgave.html ligger oplysninger på 96 kvinder, dels af den anvendte stimulationsmetode (treat) og dels af de 4 hormonkoncentrationer (to hormoner, på såvel højre som venstre side). Datasættet indeholder ikke individuelle registreringer af kvaliteten af de udtagne æg, men nedenfor ses en opgørelse over fordelingen af lav resp. høj kvalitet af disse, sammenholdt med stimulationsmetoden Treat=1 Treat=2 Total Ægkvalitet dårlig god Total 21 30 51 14 31 45 35 62 96 I de første 4 spørgsmål fokuserer vi udelukkende på målingerne på venstre side 1. Lav en figur til illustration af forskellene på de to behandlingsgrupper forsåvidt angår testosteron? Udfør på baggrund af denne tegning en sammenligning af de to grupper på passende skala og kvantificer forskellen med konfidensinterval. 1 Vi starter med et simpelt scatter plot proc gplot data=a1; plot testo_left*treat; run; som dog er gjort lidt pænere ved at skrive title ’spm 1’; proc gplot data=a1; plot testo_left*treat / frame haxis=axis1 vaxis=axis2; axis1 offset=(8,8) value=(h=3) minor=NONE label=(H=3); axis2 value=(h=3) minor=NONE label=(A=90 R=0 H=3); symbol1 v=circle i=none c=blue h=3; run; Man bemærker her, at fordelingen i begge grupper er en anelse skæv, med en hale mod de høje værdier. Da vi er på vej mod en sammenligning af grupperne med et T-test, forsøger vi at transformere med 2 logaritmen for at opnå symmetriske fordelinger (helst normalfordelinger). Her er anvnedt 10-tals logaritmer, men det spiller ingen rolle. Ud fra denne figur ser det fornuftigt ud at foretage et uparret T-test, idet • Observationerne antages uafhængige (forskellige kvinder) • Der synes at være nogenlunde samme variation i begge grupper • Fordelingerne ser rimeligt symmetriske/normalfordelte ud Man kan selvfølgelig supplere med fraktildiagrammer, men det skønnes ikke at være nødvendigt her, ikke mindst fordi fordelingsantagelsen ikke er voldsomt kritisk, hvis vi blot skal sammenligne middelværdier og ikke udtale os om enkeltindivider. Vi udfører så det uparrede T-test: proc ttest data=a1; class treat; var log_testo_left; run; og får outputtet 3 The TTEST Procedure Variable: log_testo_left treat 1 2 Diff (1-2) treat 1 2 Diff (1-2) Diff (1-2) N 48 42 Mean 1.4199 1.3649 0.0550 Std Dev 0.1687 0.1681 0.1684 Pooled Satterthwaite Mean 1.4199 1.3649 0.0550 0.0550 Method Method Pooled Satterthwaite Variances Equal Unequal Std Err 0.0244 0.0259 0.0356 Minimum 1.0175 1.0026 95% CL Mean 1.3709 1.4689 1.3125 1.4173 -0.0157 0.1257 -0.0157 0.1257 DF 88 86.505 t Value 1.55 1.55 Maximum 1.8925 1.7956 Std Dev 0.1687 0.1681 0.1684 Pr > |t| 0.1258 0.1258 Equality of Variances Method Folded F Num DF 47 Den DF 41 F Value 1.01 Pr > F 0.9859 Her ser vi • Der indgår i alt 90 personer i vores sammenligning, idet nogle kvinder har manglende værdier for testosteron på venstre side. • Spredningerne i de to grupper er meget ens (0.1687 hhv. 0.1681, P-værdi for test af identitet af disse er 0.99. • Middelværdierne i de to grupper er ikke signifikant forskellige (P=0.13). • Den estimerede forskel på de to behandlinger er (på logaritmisk skala) 0.0550, med et konfidensinterval på (-0.0.0157, 0.1257). Tilbagetransformeres dette, fås et ratio-estimat på 100.0550 = 1.135, altså at treat=1 ligger 13.5% højere end treat=2, med et konfidensinterval på (0.96, 1.34), dvs. svarende til fra 4% under til 24% over. 2. Lav en figur til at illustrere sammenhængen mellem inhibinB og testosteron, begge målt på venstre side (benyt evt. symboler svarende til de to forskellige stimulationer). Udfør på denne baggrund en lineær regressionsanalyse (igen på passende skala), med inhibin (venstre side) som outcome og testosteron (venstre side) som forklarende variabel. Angiv estimater for intercept og hældning med konfidensintervaller samt 4 spredning omkring regressionslinien. Giv også, så vidt muligt, fortolkninger af disse. Her er det naturligt at starte med et scatterplot, hvor outcome (inhibin på venstre side) sættes på Y-aksen, medens kovariaten (testosteron på venstre side) sættes på X-aksen. Nedenfor er tilføjet regressionslinier som støtte for vurderingen af rimeligheden af forudsætningerne for at foretage regressionsanalysen. Denne figur viser, at residualerne fra en regressionsanalyse på disse utransformerede data ville have to problemer • Residualerne har ikke samme spredning for alle niveuer af outcome, men har derimod en tendens til at være større (numerisk, dvs. både store neagtive og store positive værdier) for de høje (forventede) værdier af outcome. Dette illustreres også ved det trompetagtige udseende af plottet af residualer mod forventede værdier for denne regressionsanalyse på utransformeret skala 5 • Residualerne er ikke normalfordelte, men har en hale mod de store værdier. Dette illustreres bedst ved et fraktildiagram, der klart har “hængekøjefacon” I lyset af disse problemer, vil vi transformere vores outcome med en logaritme, og vi holder os til 10-tals logaritmen. Der er ikke noget i de ovenstående problemer, der indikerer, at vi skal transformere vores kovariat. I så fald skulle der fremkomme buer på et plot af residualer mod kovariaten, men da dette fuldstændig vil ligne ovenstående plot mod de forventede værdier (bortset fra en 6 spejling), kan vi allerede ud fra det ovenstående se, at der næppe er nogen problemer med lineariteten. Alligevel kan det rent fortolkningsmæssigt være rimeligt at transformere kovariaten også, da der i begge tilfælde er tale om koncentrationer. Vi vil derfor her vise begge muligheder, og de forskellige fortolkninger, de fører til. Først situationen, hvor kovariaten (testosteron, venstre side) ikke er logaritmeret: med den tilhørende regressionsanalyse: proc glm data=a1; model log_inhibin_left = testo_left / solution clparm; run; The GLM Procedure Number of Observations Read Number of Observations Used 96 89 The GLM Procedure 7 Dependent Variable: log_inhibin_left Source Model Error Corrected Total R-Square 0.232259 DF 1 87 88 Coeff Var 19.72328 Sum of Squares 2.41021806 7.96707856 10.37729662 Root MSE 0.302615 Mean Square 2.41021806 0.09157562 F Value 26.32 Pr > F <.0001 log_inhibin_left Mean 1.534302 Standard Error 0.07974468 0.00271262 Parameter Intercept testo_left Estimate 1.908854686 -0.013916397 Parameter Intercept testo_left 95% Confidence Limits 1.750353501 2.067355871 -0.019308018 -0.008524776 t Value 23.94 -5.13 Pr > |t| <.0001 <.0001 Vi er nu nede på 89 observationer i analysen, idet der yderligere er røget en ud på grund af manglende værdier for inhibin på venstre side. Estimatet for interceptet ses at være 1.909 med tilhørende konfidensinterval (1.750, 2.067), men dette er helt meningsløst, da det refererer til en testosteronværdi på 0. Estimatet for hældningen er −0.0139, med et konfidensinterval på (−0.0193, −0.0085) og dette viser tydeligt den negative association mellem de to hormonværdier. Hvis vi omsætter relationen til den oprindelige skala, har vi inhibin = 10(1.909−0.0139×testosteron) = 81.068 × 0.97testosteron Fortolkningen af den tilbagetransformerede hældning 10−0.0139 = 0.97 er altså, at hver gang testosteron øges med 1 enhed, så falder inhibin med 3%. Hvis testosteron øges med 10 enheder, bliver den tilsvarende faktor 10−0.0139×10 = 10−0.139 = 0.73, altså et fald på 27%. Estimatet for spredningen omkring regressionslinien er 0.3026, og dette skal bruges til konstruktion af normalområder. Man kan godt tilbagetransformere denne spredning, men så bliver det hele meget sværere. Det er bedst (lettest) at udregne normalområder på logaritmisk skala og så tilbagetransformere endepunkterne. Dette skal vi gøre i spørgsmål 3 nedenfor. 8 Hvis vi også logaritmetransformerer kovariaten testosteron: og dernæst laver regressionsanalysen proc glm data=a1; model log_inhibin_left = log_testo_left / solution clparm; run; finder vi outputtet The GLM Procedure Number of Observations Read Number of Observations Used 96 89 The GLM Procedure Dependent Variable: log_inhibin_left Source Model Error Corrected Total R-Square 0.229120 Coeff Var 19.76355 DF 1 87 88 Sum of Squares 2.37764809 7.99964853 10.37729662 Root MSE 0.303233 Mean Square 2.37764809 0.09194998 F Value 25.86 log_inhibin_left Mean 1.534302 9 Pr > F <.0001 Standard Error 0.03568669 Parameter log-inhibin for testo 30 Estimate 1.45545953 Parameter log-inhibin for testo 30 95% Confidence Limits 1.38452837 1.52639069 Standard Error 0.26656726 0.18965940 Parameter Intercept log_testo_left Estimate 2.879927992 -0.964433621 Parameter Intercept log_testo_left 95% Confidence Limits 2.350096689 3.409759295 -1.341402223 -0.587465020 t Value 40.78 t Value 10.80 -5.09 Pr > |t| <.0001 Pr > |t| <.0001 <.0001 Estimatet for interceptet ses at være 2.880 med tilhørende konfidensinterval (2.350, 3.410), men dette er næsten ligeså meningsløst som ovenfor, idet det refererer til en testosteronværdi på 1 (fordi logaritmen til 1 er 0). Estimatet for hældningen er −0.9644, med et konfidensinterval på (−1.341, −0.587), som igen viser den negative association mellem de to hormonværdier. Hvis vi omsætter relationen til den oprindelige skala, har vi denne gang inhibin = 10(2.880−0.9644×log10(testosteron)) = 758.6 × testosteron−0.9644 altså meget tæt på en omvendt proportionalitet. I dette tilfælde er det således ikke strengt nødvendigt at tilbagetransformere hældningen. Gør man det alligevel, får man effekten af at 10-doble testosteronværdien, 10−0.9644 = 0.11, altså at inhibin falder med 89% eller til 11% af hvad den var før. Interessant er det, at når begge variable (outcome såvel som kovariat) logaritmetransformeres, så får man samme hældning uanset hvilken logaritme, man benytter (blot man selvfølgelig benytter samme logaritme på begge). Det betyder, at man også direkte kan se effekten af en fordobling af testosteronværdien, nemlig en faktor 2−0.9644 = 0.51, på inhibin-værdien, altså et fald til ca. halvdelen, netop svarende til den omvendte proportionalitet. Estimatet for spredningen omkring regressionslinien er 0.3032, næsten fuldstændigt det samme som ovenfor (0.3026), så det er svært på denne 10 baggrund at sige, hvilken model, der er bedst. Vi kan lige med et par residualplots (svarende til dem ovenfor for den utransformerede outcome variable) sikre os, at vores model ser fornuftig ud. Det ses, at forudsætningerne ser fornuftige ud, idet residualerne har nogenlunde samme spredning uanset niveauet af outcome variablen, og at de er nogenlunde normalfordelte. Samme konklusion fås fra modelkontrol i tilfælde af, at kovariaten ikke er logaritmetransformeret. 11 3. Hvad er den forventede værdi af inhibinB for en kvinde med en testosteron på 30? Og hvad er normalområdet for sådanne kvinder? Er det usædvanligt at se en kvinde med en inhibinB-værdi på 100 og en testosteron-værdi på 30? I modellen, hvor kovariaten testosteron er utransformeret, finder vi den ønskede predikterede værdi ved hjælp af en estimate-sætning: proc glm data=a1; model log_inhibin_left = testo_left / solution clparm; estimate ’log-inhibin for testo 30’ intercept 1 testo_left 30; run; som giver de ekstra linier Standard Error 0.03315106 Parameter log-inhibin for testo 30 Estimate 1.49136278 Parameter log-inhibin for testo 30 95% Confidence Limits 1.42547146 1.55725411 t Value 44.99 Pr > |t| <.0001 Den predikterede inhibin værdi er således 101.4955 = 31.0, og normalområdet på logaritmisk skala er 1.4914 ± 2 × 0.3026 = (0.886, 2.097) Da dette indeholder 2 = log10 (100) er kombinationen ikke usædvanlig. Vi kan også tilbagetransformere normalområdet til 10(0.886,2.097) = (7.69, 124.91), som jo indeholder 100. I modellen hvor testosteron også er logaritmetransformeret, skal vi lige huske at benytte den transformerede værdi i estimate-sætningen, altså log10(30)=1.477 proc glm data=a1; model log_inhibin_left = log_testo_left / solution clparm; estimate ’log-inhibin for testo 30’ intercept 1 log_testo_left 1.477; run; 12 hvorved vi finder Standard Error 0.03568669 Parameter log-inhibin for testo 30 Estimate 1.45545953 Parameter log-inhibin for testo 30 95% Confidence Limits 1.38452837 1.52639069 t Value 40.78 Pr > |t| <.0001 Den predikterede inhibin værdi er her 101.4555 = 28.5, og normalområdet på logaritmisk skala er 1.4555±2×0.3032 = (0.849, 2.062). Da dette indeholder 2 = log10 (100) er kombinationen ikke usædvanlig. Vi kan også tilbagetransformere normalområdet til 10(0.849,2.062) = (7.06, 115.32), som jo indeholder 100. Hvis man havde gennemført disse beregninger i en model, hvor inhibin ikke var logaritmetransformeret, ville man have fået et normalområde, der indeholdt negative værdier. Dette bør altid lede til eftertanke om, hvad der er galt med modellen!! Bemærk i øvrigt, at det i dette spørgsmål er vigtigt om normalfordelingen og den konstante varians (spredning) holder, idet vi udtaler os om enkeltobservationer. I de to næste spørgsmål fokuserer vi på prediktion af inhibin målinger på venstre side. I spørgsmål 2 ovenfor predikterede vi denne ud fra testosteron på venstre side, men nu inddrager vi også hormoner målt på højre side som forklarende variable. 4. Er testosteron værdien på højre side ligeså god til at prediktere som testosteron på venstre side var (i spørgsmål 2)? Vi springer over scatterplot, modelkontrol osv., da dette helt følger overvejelserne fra forrige spørgsmål. Endvidere ser vi kun på situationen, hvor kovariaten også er logaritmetransformeret. 13 proc glm data=a1; model log_inhibin_left = log_testo_right / solution clparm; estimate ’log-inhibin for testo 30’ intercept 1 log_testo_right 1.477; run; som giver outputtet The GLM Procedure Number of Observations Read Number of Observations Used 96 84 The GLM Procedure Dependent Variable: log_inhibin_left Source DF Sum of Squares Model Error Corrected Total 1 82 83 1.06811791 9.23914715 10.30726506 R-Square 0.103628 Coeff Var 21.86179 Root MSE 0.335667 Mean Square F Value Pr > F 1.06811791 0.11267253 9.48 0.0028 log_inhibin_left Mean 1.535406 Standard Error 0.04001834 Parameter log-inhibin for testo 30 Estimate 1.48574765 Parameter log-inhibin for testo 30 95% Confidence Limits 1.40613843 1.56535687 Standard Error 0.32279806 0.22805831 Parameter Intercept log_testo_right Estimate 2.522862806 -0.702176814 Parameter Intercept log_testo_right 95% Confidence Limits 1.880714634 3.165010978 -1.155857444 -0.248496185 t Value 37.13 t Value 7.82 -3.08 Pr > |t| <.0001 Pr > |t| <.0001 0.0028 Med højre sides testosteronværdi som kovariat bliver spredningen omkring regressionslinien estimeret til 0.3357, altså noget større end før (hvor vi fik 0.3032). Det lyder umiddelbart meget rimeligt, at venstresiden er bedre til at prediktere venstresiden af inhibin. Bemærk dog lige, at vores sammenligning strengt taget ikke er helt fair, idet vi i denne sidste analyse er helt nede på 84 observationer i 14 alt. Det skyldes formentlig, at analysen nu involverer målinger fra såvel højre som venstre side, med deraf følgende større risiko for manglende værdier. Vi kan også prøve at lade begge værdier indgå som kovariater på samme tid: proc glm data=a1; model log_inhibin_left = log_testo_left log_testo_right / solution clparm; run; og finder så: The GLM Procedure Number of Observations Read Number of Observations Used 96 84 Dependent Variable: log_inhibin_left Source DF Sum of Squares Model Error Corrected Total 2 81 83 2.39257531 7.91468975 10.30726506 R-Square 0.232125 Coeff Var 20.35875 Root MSE 0.312590 Mean Square F Value Pr > F 1.19628765 0.09771222 12.24 <.0001 log_inhibin_left Mean 1.535406 Standard Error 0.31484332 0.29138361 0.30792042 Parameter Intercept log_testo_left log_testo_right Estimate 2.867504827 -1.072777562 0.118679793 Parameter Intercept log_testo_left log_testo_right 95% Confidence Limits 2.241065388 3.493944267 -1.652539548 -0.493015575 -0.493985254 0.731344841 t Value 9.11 -3.68 0.39 Pr > |t| <.0001 0.0004 0.7009 altså en virkelig klar indikation af, hvilken prediktor, der er bedst, da venstreside målingerne er en stærkt signifiknat prediktor, medens højreside målingerne ikke tilføjer noget signifikant til prediktionsevnen, når man allerede kender venstreside målingerne. 15 5. Hvis vi også udnytter information om inhibin niveauet på højre side som forklarende variabel, har vi da nogen glæde af at kende de to testosteron målinger? Ovenfor så vi, at venstre sides testosteron målinger predikterede bedre end højre sides, men det virker endnu mere oplagt, at inhibin målingerne på modsatte side skulle prediktere bedst. Vi afprøver dette ved at inddrage alle tre mulige kovariater i en regressionsmodel: proc glm data=a1; model log_inhibin_left = log_inhibin_right log_testo_left log_testo_right / solution clparm; run; og finder derved outputtet The GLM Procedure Number of Observations Read Number of Observations Used 96 84 Dependent Variable: log_inhibin_left Source DF Sum of Squares Model Error Corrected Total 3 80 83 4.66166828 5.64559678 10.30726506 R-Square 0.452270 Coeff Var 17.30162 Parameter Intercept log_inhibin_right log_testo_left log_testo_right Parameter Intercept log_inhibin_right log_testo_left log_testo_right Root MSE 0.265650 Mean Square F Value Pr > F 1.55388943 0.07056996 22.02 <.0001 log_inhibin_left Mean 1.535406 Estimate Standard Error t Value Pr > |t| 1.436744809 0.512808580 -0.812436059 0.316057226 0.36777209 0.09043553 0.25184875 0.26398697 3.91 5.67 -3.23 1.20 0.0002 <.0001 0.0018 0.2347 95% Confidence Limits 0.704855018 2.168634600 0.332836147 0.692781014 -1.313631044 -0.311241074 -0.209293590 0.841408043 16 Som vi kan se, har vi i hvert fald ikke meget glæde af at kende testosteronværdien på højre side, så denne udelader vi, hvorved vi får The GLM Procedure Dependent Variable: log_inhibin_left Source DF Sum of Squares Model Error Corrected Total 2 81 83 4.56051352 5.74675154 10.30726506 R-Square 0.442456 Coeff Var 17.34784 Parameter Intercept log_inhibin_right log_testo_left Parameter Intercept log_inhibin_right log_testo_left Root MSE 0.266360 Mean Square F Value Pr > F 2.28025676 0.07094755 32.14 <.0001 log_inhibin_left Mean 1.535406 Estimate Standard Error t Value Pr > |t| 1.615976232 0.498532102 -0.606889805 0.33682201 0.08988544 0.18475535 4.80 5.55 -3.28 <.0001 <.0001 0.0015 95% Confidence Limits 0.945806077 2.286146386 0.319688279 0.677375925 -0.974494992 -0.239284619 Vi ser, at der stadig ligger noget information i at kende testosteron værdien på venstre side. I denne model er residualspredningen 0.2664, altså en del lavere end modellen uden inhibin højre side som kovariat. Bemærk, at man ikke bør sammenligne R2 -værdierne for modeller, der ikke har det samme antal kovariater, da denne altid vil være mindre, når der er flere kovariater med. Til sammenligning får vi en residualspredning på 0.2818, hvis vi udelukkende medtager højresidige inhibin målinger som kovariat, se nedenfor: proc glm data=a1; model log_inhibin_left = log_inhibin_right / solution clparm; run; 17 The GLM Procedure Dependent Variable: log_inhibin_left Source DF Sum of Squares Model Error Corrected Total 1 82 83 3.79498204 6.51228302 10.30726506 R-Square 0.368185 Coeff Var 18.35424 Root MSE 0.281812 Mean Square F Value Pr > F 3.79498204 0.07941809 47.78 <.0001 log_inhibin_left Mean 1.535406 Standard Error 0.13913589 0.08814862 Parameter Intercept log_inhibin_right Estimate 0.5973875565 0.6093414159 Parameter Intercept log_inhibin_right 95% Confidence Limits 0.3206019573 0.8741731557 0.4339857205 0.7846971114 t Value 4.29 6.91 Pr > |t| <.0001 <.0001 For en ordens skyld skal vi lige overbevise os selv om, at den multiple regressionsmodel overhovedet var rimelig, dvs. vi skal udføre de sædvanlige modelkontroltegninger. Det drejer sig om residualer plottet mod hver af kovariaterne (her kun vist for de to vigtigste), residualer plottet mod forventede værdier af outcome samt fraktildiagram over residualerne. I de to næste spørgsmål fokuserer vi på sideforskelle for testosteron 6. Beskriv den naturligt forekommende variation i testosteron mellem en kvindes to æggestokke, evt opdelt efter behandlingsgruppe, hvis dette skønnes relevant. Kvantificer ved hjælp af limits of agreement på den relevante skala. Når vi skal beskrive variationen mellem hormon niveauerne på højre og venstre side, er det oplagt at tage udgangspunkt i forskellene på de to sider og kvantificere størrelsen af disse. Først skal man først sikre sig, at det er fornuftigt at se på differenser, dvs. om størrelsen af disse er nogenlunde uafhængigt at hormon niveauet. Dette gør vi ved hjælp af et Bland-Altman plot, som blot er et scatter plot af differenserne mellem højre og venstre, plottet mod gennemsnittet af de selvsamme værdier: 18 data a1; set a1; dif_testo=testo_right-testo_left; snit_testo=(testo_left+testo_right)/2; dif_log_testo=log_testo_right-log_testo_left; snit_log_testo=(log_testo_left+log_testo_right)/2; run; proc gplot data=a1; plot dif_testo*snit_testo=treat / vref=0 lv=33 nolegend frame haxis=axis1 vaxis=axis2; axis1 offset=(8,8) value=(h=3) minor=NONE label=(H=3); axis2 value=(h=3) minor=NONE label=(A=90 R=0 H=3); symbol1 v=circle i=none c=blue h=3 w=3 l=1 r=1; symbol2 v=star i=none c=red h=3 w=3 l=1 r=2; run; 19 som giver plottet Her ses en klar trompetfacon, svarende til, at differenserne klart bliver (numerisk) større ved de højere koncentrationer. Forskellen mellem højre og venstre er derfor bedre udtrykt i relative termer, altså som procentvise forskelle, så også her skal vi se på logaritmetransformerede data: Her ser det pænere ud, pånær en enkelt outlier, så på denne skala vil 20 vi kvantificere differenserne, enten for hver behandling for sig (det gør vi ikke her), eller fælles for begge behandlinger. Bemærk, at forudsætningerne om de ens spredninger (Bland-Altman plottet) og normalfordelingsantagelsen (fraktildiagrammet nedenfor) her er meget vigtigere end i de tidligere spørgsmål (med undtagelse af spørgsmål 3), idet vi her vil udtale os om enkeltindivider og ikke blot gruppegennemsnit. For at kvantificere differenserne, udregner vi de relevante summary statistics: proc means N Nmiss mean std data=a1; var dif_log_testo; run; og får outputtet The MEANS Procedure Analysis Variable : dif_log_testo N N Miss Mean Std Dev -----------------------------------------85 11 0.0099032 0.1232715 ------------------------------------------ 21 Ud fra gennemsnit og spredning af differenserne på logaritmsik skala, udregner vi limits of agreement: 0.0099032 ± 2 × 0.1232715 = (−0.2366398, 0.2564462), som tilbagetransformeret giver estimatet 100.0099032 = 1.02 for ratio mellem siderne, med tilhørende limits of agreement 10(−0.2366398,0.2564462) = (0.58, 1.80) Vi kan således konkludere, at 95% af forskellene højre/venstre ligger mellem ratioerne 0.58 og 1.80, svarende til at højre æggestok ligger mellem 42% under til 80% over venstre æggestok. Da der næsten ikke er nogen systematisk forskel (højre æggestok ligger i gennemsnit kun 2% højere end venstre æggestok), ville vi finde ganske det tilsvarende, hvis vi var startet med at se på forskelle ’den anden vej’, altså venstre-højre. Dette virker måske sært pga de tilsyneladende asymmetriske grænser, men man skal tænke på, at hvis højre side ligger 80% over venstre side (svarende til f.eks. 20 og 36), så ligger venstre side 16/36 × 100 = 44.4% under højre side. 7. Er der systematisk forskel på testosteronværdierne på højre og venstre side? Kvantificer på passende skala, med konfidensinterval, og giv en fortolkning. Dette spørgsmål besvares ved at udføre et T-test. Dette kan gøres ved hjælp af proc means, og hvis man bruger option clm, får man også konfidensintervallet med. proc means N Nmiss mean stderr clm probt; var dif_log_testo; run; med outputtet The MEANS Procedure Analysis Variable : dif_log_testo 22 N Lower 95% Upper 95% N Miss Mean Std Error CL for Mean CL for Mean Pr > |t| -------------------------------------------------------------------------85 11 0.0099032 0.0133707 -0.0166858 0.0364923 0.4610 -------------------------------------------------------------------------- Vi finder ingen signifikant forskel (P=0.46). For at se, om vi burde behandle de to grupper hver for sig, kunne vi se på et scatter plot af de to sæt differenser: eller måske endda et uparret T-test af de to (idet forudsætningerne for et sådant ses at være rimelige udfra ovenstående plot): proc ttest data=a1; class treat; var dif_log_testo; run; The TTEST Procedure Variable: dif_log_testo 23 treat 1 2 Diff (1-2) N 45 40 Mean 0.0286 -0.0111 0.0397 treat 1 2 Diff (1-2) Diff (1-2) Method Pooled Satterthwaite Method Pooled Satterthwaite Variances Equal Unequal Std Dev 0.1086 0.1363 0.1224 Std Err 0.0162 0.0215 0.0266 Mean 0.0286 -0.0111 0.0397 0.0397 DF 83 74.422 Minimum -0.2076 -0.5270 95% CL Mean -0.00405 0.0612 -0.0547 0.0325 -0.0132 0.0926 -0.0140 0.0934 t Value 1.49 1.47 Maximum 0.3113 0.2864 Std Dev 0.1086 0.1363 0.1224 Pr > |t| 0.1396 0.1452 Equality of Variances Method Folded F Num DF 39 Den DF 44 F Value 1.58 Pr > F 0.1444 som viser, at det ikke er særligt påkrævet at opdele (P = 0.14 for identitet af middelværdier for de to sæt differenser, P = 0.14 for identitet af de tilsvarende varianser). Testet for “ingen forskel” mellem højre og venstre kan naturligvis også udføres som et T-test, men nu er der tale om et parret T-test. Dette kan udføres enten som et one-sample T-test på differenserne (på logaritmisk skala), eller som et parret T-test på de to sider (igen logaritmetransformeret): proc ttest; var dif_log_testo; run; proc ttest data=a1; paired log_testo_left*log_testo_right; run; og som output fås nedenstående The TTEST Procedure Variable: dif_log_testo 24 N 85 Mean 0.00990 Mean 0.00990 DF 84 Std Dev 0.1233 95% CL Mean -0.0167 0.0365 t Value 0.74 Std Err 0.0134 Minimum -0.5270 Std Dev 0.1233 Maximum 0.3113 95% CL Std Dev 0.1071 0.1452 Pr > |t| 0.4610 The TTEST Procedure Difference: N 85 log_testo_left - log_testo_right Mean -0.00990 Mean -0.00990 DF 84 Std Dev 0.1233 95% CL Mean -0.0365 0.0167 t Value -0.74 Std Err 0.0134 Std Dev 0.1233 Minimum -0.3113 Maximum 0.5270 95% CL Std Dev 0.1071 0.1452 Pr > |t| 0.4610 Vi finder (selvfølgelig ganske som ovenfor) ingen signifikant forskel (P=0.46). Den estimerede forskel (højre minus venstre) er (på logaritmisk skala) 0.0099, med et konfidensinterval på (-0.1267, 0.0365). Tilbagetransformeres dette, fås som før ratio-estimatet på 1.02, nu med 95% konfidensinterval på (0.96, 1.09). Det betyder, at værdierne på højre side i gennemsnit ligger 2% over de tilsvarende i venstre side, men usikkerheden på dette estimat viser, at det ligeså godt kunne dreje sig om 9% over, eller 4% under. I de to sidste spørgsmål ser vi på ægkvaliteten, som givet i to gange to tabellen på forsiden. 8. Giv et estimat for sandsynligheden for høj ægkvalitet, for hver af de to stimulationsmetoder hver for sig. Ser de to estimater forskellige ud? Først skal vi indlæse disse ekstra data i en to gange to tabel, og udregne de relevante procenter. Vi sætter tabellen op, så behandlingerne (treat) er rækkerne, og udfaldene (hhv. god(1) og dårlig(0) ægkvalitet) er kolonnerne. De relevante procenter er således rækkeprocenter, og vi undertrykker derfor de øvrige: 25 data a1; input treat kvalitet antal; cards; 1 0 21 1 1 30 2 0 14 2 1 31 ; run; title ’spm 8’; proc freq data=a1; tables treat*kvalitet / nopercent nocol; weight antal; run; Dette giver os output i form af tabellen The FREQ Procedure Table of treat by kvalitet treat kvalitet Frequency| Row Pct | 0| 1| ---------+--------+--------+ 1 | 21 | 30 | | 41.18 | 58.82 | ---------+--------+--------+ 2 | 14 | 31 | | 31.11 | 68.89 | ---------+--------+--------+ Total 35 61 Total 51 45 96 hvoraf vi aflæser, at treatment 1 har en estimeret sandsynlighed for god ægkvalitet på 58.82%, hvorimod treatment 2 ligger helt oppe på 68.89%, altså noget højere. 9. Lav et test for om kvaliteten af de udtagne æg afhænger af stimulationsmetoden. Kvantificere forskellen, dels som en forskel på de to sandsynligheder fundet ovenfor og dels som en odds ratio. Husk i begge tilfælde 26 at supplere med et konfidensinterval. Kan vi udelukke, at der er dobbelt så stor sandsynlighed (eller odds) for at have god ægkvalitet i den ene gruppe i forhold til den anden? Vi udvider vores analyse af to gange to tabellen med et par ekstra options: • expected: De forventede counts i hver celle, under hypotesen om “ingen forskel på behandlingerne”. dem skal vi bruge til at vurdere om Chi-i-anden testet er tilladeligt at udføre • chisq: Chi-i-anden testet skal udskrives • riskdiff: Estimater for forskellen mellem sandsynlighederne for god ægkvalitet skal udskrives • relrisk: Estimat for den relative risiko skal udskrives title ’spm 8’; proc freq data=a1; tables treat*kvalitet / nopercent nocol expected chisq riskdiff relrisk; weight antal; run; som giver outputtet The FREQ Procedure Table of treat by kvalitet treat kvalitet Frequency| Expected | Row Pct | 0| 1| ---------+--------+--------+ 1 | 21 | 30 | | 18.594 | 32.406 | | 41.18 | 58.82 | ---------+--------+--------+ 2 | 14 | 31 | | 16.406 | 28.594 | | 31.11 | 68.89 | ---------+--------+--------+ Total 35 61 Total 51 45 96 27 Statistics for Table of treat by kvalitet Statistic DF Value Prob -----------------------------------------------------Chi-Square 1 1.0455 0.3066 Likelihood Ratio Chi-Square 1 1.0506 0.3054 Continuity Adj. Chi-Square 1 0.6561 0.4179 Mantel-Haenszel Chi-Square 1 1.0346 0.3091 Phi Coefficient 0.1044 Contingency Coefficient 0.1038 Cramer’s V 0.1044 Fisher’s Exact Test ---------------------------------Cell (1,1) Frequency (F) 21 Left-sided Pr <= F 0.8918 Right-sided Pr >= F 0.2092 Table Probability (P) Two-sided Pr <= P 0.1010 0.3960 Column 1 Risk Estimates (Asymptotic) 95% (Exact) 95% Risk ASE Confidence Limits Confidence Limits ------------------------------------------------------------------------Row 1 0.4118 0.0689 0.2767 0.5468 0.2758 0.5583 Row 2 0.3111 0.0690 0.1758 0.4464 0.1817 0.4665 Total 0.3646 0.0491 0.2683 0.4609 0.2687 0.4691 Difference 0.1007 0.0975 -0.0905 0.2918 Difference is (Row 1 - Row 2) The FREQ Procedure Statistics for Table of treat by kvalitet Column 2 Risk Estimates (Asymptotic) 95% (Exact) 95% Risk ASE Confidence Limits Confidence Limits ------------------------------------------------------------------------Row 1 0.5882 0.0689 0.4532 0.7233 0.4417 0.7242 Row 2 0.6889 0.0690 0.5536 0.8242 0.5335 0.8183 Total 0.6354 0.0491 0.5391 0.7317 0.5309 0.7313 Difference -0.1007 0.0975 -0.2918 0.0905 Difference is (Row 1 - Row 2) Estimates of the Relative Risk (Row1/Row2) Type of Study Value 95% Confidence Limits ----------------------------------------------------------------Case-Control (Odds Ratio) 1.5500 0.6677 3.5982 Cohort (Col1 Risk) 1.3235 0.7677 2.2817 Cohort (Col2 Risk) 0.8539 0.6312 1.1551 28 Sample Size = 96 Vi ser af såvel χ2 -test og Fishers eksakte test, at der ikke er signifikant forskel på ægkvaliteten for de to behandlinger (P=0.31 hhv. 0.40). De forventede antal er alle et pænt stykke over de krævede 5 (minimum 16.4), så det er ikke nødvendigt at lave Fishers eksakte test, da chi-ianden approksimationen er god nok. Den estimerede forskel på de to sandsynligheder for god ægkvalitet (Column 2 risk) er 0.1007 (=0.6889-0.5882), altså 10 procentpoint, med konfidensgrænser (-0.09,0.29). Der kan altså med rimelighed være op til 29% større sandsynlighed for god ægkvalitet for treatment 2. Odds ratio estimeres til 1.550 med konfidensinterval (0.667, 3.598), og dette indeholder et 2-tal. Det samme er tilfældet for den relative risiko for dårlig ægkvalitet (Col1 Risk), men ikke for god ægkvalitet (Col2 Risk). Man kan derfor ikke sige, at sandsynligheden for god ægkvalitet kan være dobbelt så stor i den ene gruppe i forhold til den anden, men man kan sige, at den ene gruppe (gruppe 2) kan have dobbelt så store odds for god ægkvalitet. 29
© Copyright 2024