Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby – Danmark e-mail: [email protected] Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 1 / 33 Oversigt 1 2 Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion Fordelingsfunktion Middelværdi af en kontinuert stokastisk variabel Varians af en kontinuert stokastisk variabel Konkrete Statistiske fordelinger Normalfordelingen Eksempel Eksempel Eksempel Eksempel Eksempel 1 2 3 4 5: Approximation af binomialfordeling Log-Normal fordelingen Eksempel 6 Uniform fordelingen Eksempel 7 3 R (R Note afsnit 4 ) Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 2 / 33 Kontinuerte Stokastiske variable og fordelinger Oversigt 1 2 Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion Fordelingsfunktion Middelværdi af en kontinuert stokastisk variabel Varians af en kontinuert stokastisk variabel Konkrete Statistiske fordelinger Normalfordelingen Eksempel Eksempel Eksempel Eksempel Eksempel 1 2 3 4 5: Approximation af binomialfordeling Log-Normal fordelingen Eksempel 6 Uniform fordelingen Eksempel 7 3 R (R Note afsnit 4 ) Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 3 / 33 Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion Tæthedsfunktion Tæthedsfunktionen for en stokastisk variabel betegnes ved f (x) f (x) siger noget om hyppigheden af udfaldet x for den stokastiske variabel X For kontinuerte variable svarer tætheden ikke til sandsynligheden, dvs. f (x) 6= P (X = x) Et godt plot af f (x) er et histogram (kontinuert) Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 4 / 33 Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion Tæthedsfunktion for en kontinuert variabel For en kontinuert stokastisk variabel skrives tæthedsfunktionen som: f (x) Der gælder: f (x) > 0 for x ∈ S f (x) = 0 for x ∈ /S Z ∞ f (x)dx = 1 −∞ Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 5 / 33 Kontinuerte Stokastiske variable og fordelinger Fordelingsfunktion Fordelingsfunktion Fordelingsfunktion for en kontinuert stokastisk variabel betegnes ved F (x). Fordelingsfunktionen svarer til den kumulerede tæthedsfunktion: F (x) = P (X ≤ x) Z x F (x) = f (t)dt t=−∞ Et godt plot for fordelingsfunktionen er den kumulative fordeling Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 6 / 33 Kontinuerte Stokastiske variable og fordelinger Middelværdi af en kontinuert stokastisk variabel Middelværdi af en kontinuert stokastisk variabel Middelværdien af en kontinuert stokastisk variabel beregnes ved: Z x · f (x)dx µ= S hvor S er udfaldsrummet for X Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 7 / 33 Kontinuerte Stokastiske variable og fordelinger Varians af en kontinuert stokastisk variabel Varians af en kontinuert stokastisk variabel Variansen af en kontinuert stokastisk variabel beregnes ved: Z 2 σ = (x − µ)2 · f (x)dx S hvor S er udfaldsrummet for X Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 8 / 33 Konkrete Statistiske fordelinger Oversigt 1 2 Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion Fordelingsfunktion Middelværdi af en kontinuert stokastisk variabel Varians af en kontinuert stokastisk variabel Konkrete Statistiske fordelinger Normalfordelingen Eksempel Eksempel Eksempel Eksempel Eksempel 1 2 3 4 5: Approximation af binomialfordeling Log-Normal fordelingen Eksempel 6 Uniform fordelingen Eksempel 7 3 R (R Note afsnit 4 ) Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 9 / 33 Konkrete Statistiske fordelinger Konkrete statistiske fordelinger Der findes en række statistiske fordelinger, som kan bruges til at beskrive og analysere forskellige problemstillinger med Vi betragter nu kontinuerte fordelinger Normal fordelingen Log-Normal fordelingen Uniform fordelingen Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 10 / 33 Konkrete Statistiske fordelinger Normalfordelingen Normalfordelingen Normalfordeling 0.5 0.45 0.4 0.35 Taethed, f(x) 0.3 0.25 0.2 0.15 0.1 0.05 0 −5 −4 −3 Per Bruun Brockhoff ([email protected]) −2 −1 0 x 1 2 Introduktion til Statistik, Forelæsning 3 3 4 5 Foråret 2014 11 / 33 Konkrete Statistiske fordelinger Normalfordelingen Normal fordelingen X ∼ N (µ, σ 2 ) tæthedsfunktion: 2 (x−µ) f (x) = σ√12π e− 2σ2 Middelværdi: µ=µ Varians: σ2 = σ2 Tabel 3 for F (x) Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 12 / 33 Konkrete Statistiske fordelinger Normalfordelingen Normalfordelingen Normalfordeling N(0,12) 0.45 0.4 0.35 Taethed, f(x) 0.3 0.25 0.2 0.15 0.1 0.05 0 −3σ −0.05 −5 −4 −3 Per Bruun Brockhoff ([email protected]) −2σ −2 −σ −1 µ σ 2σ 3σ 0 x 1 2 3 Introduktion til Statistik, Forelæsning 3 4 5 Foråret 2014 13 / 33 Konkrete Statistiske fordelinger Normalfordelingen Normalfordelingen Sammenligning af to normalfordelinger med forskellig middelvardi og ens varians 0.45 N(5,12) N(0,12) 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 −0.05 −5 Per Bruun Brockhoff ([email protected]) 0 5 Introduktion til Statistik, Forelæsning 3 10 Foråret 2014 14 / 33 Konkrete Statistiske fordelinger Normalfordelingen Normalfordelingen Sammenligning af tre normalfordelinger med ens middelvardi og forskellig varians 0.5 Taethed, f(x) 0.4 0.3 0.2 0.1 0 −10 −8 −6 Per Bruun Brockhoff ([email protected]) −4 −2 0 x 2 4 Introduktion til Statistik, Forelæsning 3 6 8 10 Foråret 2014 15 / 33 Konkrete Statistiske fordelinger Normalfordelingen Normal fordelingen En normal fordeling med middelværdi 0 og varians 1, dvs X ∼ N (0, 12 ) kaldes en standard normal fordeling En vilkårlig normal fordelt variabel Y ∼ N (µ, σ 2 ) kan standardiseres ved at beregne X= Per Bruun Brockhoff ([email protected]) Y −µ σ Introduktion til Statistik, Forelæsning 3 Foråret 2014 16 / 33 Konkrete Statistiske fordelinger Normalfordelingen Eksempel 1 En vægt har en målefejl, E, der kan beskrives ved en standard normalfordeling, dvs E ∼ N (0, 12 ) dvs. middelværdi µ = 0 og spredning σ = 1 gram. Vi måler nu vægten af ét emne a) hvad er sandsynligheden for at vægten måler mindst 2 gram for lidt? Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 17 / 33 Konkrete Statistiske fordelinger Normalfordelingen Eksempel 1 b) hvad er sandsynligheden for at vægten måler mindst 2 gram for meget? c) hvad er sandsynligheden for at vægten måler højst ±1 gram forkert? Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 18 / 33 Konkrete Statistiske fordelinger Normalfordelingen Eksempel 2 Det antages, at blandt en gruppe lærere i folkeskolen, at lønnen kan beskrives ved en normalfordeling med middelværdi µ = 280.000 og spredning σ = 10.000. a) hvad er sandsynligheden for at en tilfældig udvalgt lærer tjener mere end 300.000? Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 19 / 33 Konkrete Statistiske fordelinger Normalfordelingen Eksempel 3 Det antages, at blandt en gruppe lærere i folkeskolen, at lønnen kan beskrives ved en normalfordeling med middelværdi µ = 290.000 og spredning σ = 4.000. a) hvad er sandsynligheden for at en tilfældig udvalgt lærer tjener mere end 300.000? Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 20 / 33 Konkrete Statistiske fordelinger Normalfordelingen Eksempel 4 Det antages, at blandt en gruppe lærere i folkeskolen, at lønnen kan beskrives ved en normalfordeling med middelværdi µ = 290.000 og spredning σ = 4.000. a) angiv det interval, der dækker over 95% af læreres løn Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 21 / 33 Konkrete Statistiske fordelinger Normalfordelingen Eksempel 5: Approximation af binomialfordeling I et dosis-respons forsøg med 80 rotter antages at sandsynligheden for at en rotte overlever forsøget er p = 0.5. a) hvad er sandsynligheden for at højst 30 rotter dør i forsøget? b) hvad er sandsynligheden for at mellem 38 og 42 rotter dør i forsøget? Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 22 / 33 Konkrete Statistiske fordelinger Log-Normal fordelingen Log-Normal fordelingen X ∼ LN (α, β) tæthedsfunktion: ( f (x) = 2 2 √1 x−1 e−(ln(x)−α) /2β β 2π 0 x > 0, β > 0 ellers Middelværdi: 2 µ = eα+β /2 Varians: 2 2 σ 2 = e2α+β (eβ − 1) Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 23 / 33 Konkrete Statistiske fordelinger Log-Normal fordelingen Log-Normal fordelingen Log−Normalfordeling LN(1,1) 0.25 0.2 LN(1,1) Taethed, f(x) 0.15 0.1 0.05 0 0 5 Per Bruun Brockhoff ([email protected]) 10 15 x 20 Introduktion til Statistik, Forelæsning 3 25 30 Foråret 2014 24 / 33 Konkrete Statistiske fordelinger Log-Normal fordelingen Log-Normal fordelingen En log-normal fordelt variabel Y ∼ LN (α, β), kan transformeres til en standard normal fordelt variabel X ved X= ln(Y ) − α β dvs. X ∼ N (0, 12 ) Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 25 / 33 Konkrete Statistiske fordelinger Log-Normal fordelingen Eksempel 6 Partikelstørrelsen (µm) i et stof kan antages at være Log-Normal fordelt. Vi har observationerne 2.2 3.4 1.6 0.8 2.7 3.3 1.6 2.8 1.9 Vi tager logaritmen af data og får: 0.8 1.2 0.5 -0.2 1.0 1.2 0.5 1.0 0.6 Heraf beregnes x¯ = 0.733 og s = 0.44. hvad er andelen af partikler med en størrelse i intervallet [2; 3] Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 26 / 33 Konkrete Statistiske fordelinger Log-Normal fordelingen Eksempel 6 Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 27 / 33 Konkrete Statistiske fordelinger Uniform fordelingen Uniform fordelingen X ∼ U (α, β) tæthedsfunktion: f (x) = 1 β−α Middelværdi: µ = α+β 2 Varians: 1 σ 2 = 12 (β − α)2 Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 28 / 33 Konkrete Statistiske fordelinger Uniform fordelingen Uniform fordelingen Uniform fordeling U(4,5) 1 Taethed, f(x) 0.8 0.6 0.4 0.2 0 3.5 Per Bruun Brockhoff ([email protected]) 4 4.5 x Introduktion til Statistik, Forelæsning 3 5 5.5 Foråret 2014 29 / 33 Konkrete Statistiske fordelinger Uniform fordelingen Eksempel 7 Medarbejdere på en arbejdsplads ankommer mellem klokken 8.00 og 8.30. Det antages, at ankomsttiden kan beskrives ved en uniform fordeling. Hvad er sandsynligheden for at en tilfældig udvalgt medarbejder (Hans) ankommer mellem 8.20 og 8.30? Hvad er sandsynligheden for at en tilfældig udvalgt medarbejder (Martin) ankommer efter 8.30? Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 30 / 33 R (R Note afsnit 4 ) Oversigt 1 2 Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion Fordelingsfunktion Middelværdi af en kontinuert stokastisk variabel Varians af en kontinuert stokastisk variabel Konkrete Statistiske fordelinger Normalfordelingen Eksempel Eksempel Eksempel Eksempel Eksempel 1 2 3 4 5: Approximation af binomialfordeling Log-Normal fordelingen Eksempel 6 Uniform fordelingen Eksempel 7 3 R (R Note afsnit 4 ) Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 31 / 33 R (R Note afsnit 4 ) R (R note afsnit 4) R norm unif lnorm exp Betegnelse Normalfordelingen Den uniforme fordeling Log-normalfordelingen Exponentialfordelingen d Tæthedsfunktion f (x) (probability density function). p Fordelingsfunktion F (x) (cumulative distribution function). q Fraktil (quantile) i fordeling. r Tilfældige tal fra fordelingen (Forelæsning 10). Eksempel: P (Z ≤ 2) Per Bruun Brockhoff ([email protected]) pnorm(2) Introduktion til Statistik, Forelæsning 3 Foråret 2014 32 / 33 R (R Note afsnit 4 ) Oversigt 1 2 Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion Fordelingsfunktion Middelværdi af en kontinuert stokastisk variabel Varians af en kontinuert stokastisk variabel Konkrete Statistiske fordelinger Normalfordelingen Eksempel Eksempel Eksempel Eksempel Eksempel 1 2 3 4 5: Approximation af binomialfordeling Log-Normal fordelingen Eksempel 6 Uniform fordelingen Eksempel 7 3 R (R Note afsnit 4 ) Per Bruun Brockhoff ([email protected]) Introduktion til Statistik, Forelæsning 3 Foråret 2014 33 / 33
© Copyright 2024