TMA4245 Statistikk V˚ar 2015 - Institutt for matematiske fag

TMA4245 Statistikk
Vår 2015
Norges teknisk-naturvitenskapelige universitet
Institutt for matematiske fag
Øving nummer 9, blokk II
Løsningsskisse
Oppgave 1
a) The probability is
R 0.9
0.5
6x(1 − x) dx =
R 0.9
0.5
(6x − 6x2 ) dx = [3x2 − 2x3 ]0.9
0.5 = 0.472.
b) The likelihood function is given by
L(β) =
n
Y
β(β + 1)xi (1 − xi )β−1 = β n (β + 1)n
i=1
n
Y
!
xi
i=1
n
Y
(1 − xi )β−1 ,
i=1
and the log likelihood
ln L(β) = n ln β + n ln(β + 1) +
n
X
ln xi + (β − 1)
i=1
n
X
ln(1 − xi ),
i=1
which has derivative
n
X
n
n
(ln L) (β) = +
+
ln(1 − xi ).
β β+1
0
i=1
(ln L)0
is decreasing on (0, ∞) and the sum of two first terms tends to ∞ when β → 0+
and to 0 when β → ∞, so that (ln L)0 will have a single zero (the third term is negative)
for β > 0 and be positive left of the zero and negative right of the zero. This means
that L has its maximum at this zero. Solving for the zero,
n
n
X
X
β2
ln(1 − xi ) + 2n +
ln(1 − xi ) β + n = 0,
i=1
i=1
we get
β=
−2n −
Pn
i=1 ln(1
p
P
− xi ) ± 4n2 + ( ni=1 ln(1 − xi ))2
P
2 ni=1 ln(1 − xi )
s
2 1
n
1
n
Pn
= − Pn
− ±
+ .
2
4
i=1 ln(1 − xi )
i=1 ln(1 − xi )
We choose the larger zero since (ln L)0 has only one zero for positive arguments (the
other we found must be negative), and get the maximum likelihood estimator
s
s
2 1
n
n
1
1
1
1
1
Pn
+ − Pn
− =
− .
2 + −
ln(1
−
X
)
4
ln(1
−
X
)
2
4
i
i
ln(1 − X) 2
ln(1 − X)
i=1
i=1
ov9-lsf-b
25. mars 2015
Side 1
TMA4245 Statistikk
Vår 2015
For n = 100 and
1/2 = 1.545.
Pn
i=1 ln(1
− xi ) = −104.0 the estimate is
p
1/1.042 + 1/4 + 1/1.04 −
(The discussion of actual attainment of maximum at the zero and of which zero to be
chosen, is not required.)
Oppgave 2
Antar antall grove fartsoverskridelser, X, over et tidsrom t er Poissonfordelt med parameter
λt.
a) Sannsynlighetsfordelingen til X er gitt ved:
P (X = x) =
(λt)x e−λt
x!
P (X = x) =
(2.5)x e−2.5
x!
Med λ = 0.5 og t = 5 får vi :
Sannsynligheten for at det skjer ingen grove overskridelser i perioden:
P (X = 0) = e−2.5 = 0.082
Sannsynligheten for at det skjer mer enn 2 grove overskridelser i perioden:
P (X > 2) = 1 − P (X ≤ 2)
= 1 − (P (X = 0) + P (X = 1) + P (X = 2))
= 1 − (0.082 + 0.205 + 0.257) = 0.456
E[X] = 2.5, Var[X] = 2.5
b) Sann fart på bilene er µ, lasermålingene er N (µ, 1.52 ). Skal finne sannsynligheten for at
laseren viser mer enn 130 km/h for en bil som kjører i 129 km/h.
Y − 129
130 − 129
P (Y > 130 | µ = 129) = P
>
1.5
1.5
= P (Z > 0.67)
= 1 − P (Z ≤ 0.67) = 1 − 0.749 = 0.251
Konstanten må oppfylle:
P (Y ≥ k | µ = 130) = 0.01
som kan omformes til
P
Y − 130
k − 130
≥
| µ = 130 = 0.01
1.5
1.5
Konstanten er dermed gitt ved:
⇔
ov9-lsf-b
k − 130
= 2.325 ⇔ k = 130 + 1.5 · 2.325 ≈ 133.5
1.5
25. mars 2015
Side 2
TMA4245 Statistikk
Vår 2015
c) Sannsynlighetstetthetsfunksjonen er gitt ved:
f (x1 , x2 , x3 , x4 | λ, t1 , t2 , t3 , t4 ) =
(λt1 )x1 e−λt1 (λt2 )x2 e−λt2 (λt3 )x3 e−λt3 (λt4 )x4 e−λt4
·
·
·
x1 !
x2 !
x3 !
x4 !
Som gir følgende likelihood:
4
P
λi=1
xi
·
4
Q
txi i
i=1
4
Q
L(λ | x1 , x2 , x3 , x4 , t1 , t2 , t3 , t4 ) =
−λ
·e
4
P
ti
i=1
xi !
i=1
⇒ ln L(λ | x1 , x2 , x3 , x4 , t1 , t2 , t3 , t4 ) = ln λ
4
X
xi + ln(
4
Y
txi i )
−λ
t=1
i=1
4
X
i=1
4
Y
ti − ln( xi !)
i=1
Deriverer og setter lik null:
1
∂ ln L(λ | . . .)
=
∂λ
λ
4
X
xi −
i=1
4
X
4
P
ti = 0 ⇒ λ =
i=1
i=1
4
P
xi
ti
i=1
dvs. sannsynlighetsmaksimeringsestimatoren er:
4
P
b=
λ
4
P
Xi
i=1
4
P
=
Xi
i=1
30
ti
i=1
Forventningsverdien til estimatoren er:
b =
E[λ]
1
1
{E[X1 ] + E[X2 ] + E[X3 ] + E[X4 ]} = {5λ + 5λ + 10λ + 10λ} = λ
30
30
og variansen er:
b =
Var[λ]
d) Y =
4
P
1
1
λ
{Var[X1 ] + Var[X2 ] + Var[X3 ] + Var[X4 ]} = 2 {5λ+ 5λ+ 10λ+ 10λ} =
2
30
30
30
Xi er Poissonfordelt med parameter λ
i=1
4
P
ti = 30λ : Med λ ≈ 0.5 er Var[Y ] ≈ 15
i=1
⇒ det er rimelig grunn til å tro at fordelingen til Y kan tilnærmes med en normalfordeling.
r
b−λ
λ
λ
Y
b=
λ
≈ n(v; λ,
) ⇒ q
≈ n(z; 0, 1)
30
30
λ
30
b−λ
b−λ
λ
λ
q
≈ q
λ
30
ov9-lsf-b
25. mars 2015
b
λ
30
Side 3
TMA4245 Statistikk
Vår 2015
Vi får:


b−λ
λ
P −z α2 < q
< z α2  ≈ 1 − α
b
λ
30
s

b − zα
⇔ P λ
2
b = 20
α = 0.05, λ
30
r
(0.67 − 1.97
s
b
λ
b + zα
<λ<λ
2
30

b
λ
≈1−α
30
⇒
et 95 % konfidensintervall blir:
r
2
2
, 0.67 + 1.97
) = (0.38, 0.96)
90
90
e)
P (T ≤ t) = 1 − P (T > t) = 1 − P (X = 0 i tidsrommet [0, t])
1 − e−λt t > 0
=
⇒ T er eksponensialfordelt.
0
ellers.
La U = min{T1 , T2 , . . . , T8 }
P (U ≤ u) = 1 − P (T1 > u, T2 > u, . . . , T8 > u) = 1 −
8
Y
P (Ti > u)
i=1
−λu
i=1 e
1−
0
1 − e−4u
0
=
=
Q8
u>0
=
ellers.
1 − e−8λu
0
u>0
ellers.
u>0
ellers.
1
P (U ≤ ) = 1 − e−1 = 1 − 0.368 = 0.632
4
Oppgave 3
(Merk: I følgje oppgåveteksten skal konfidensintervallet utleias, ikkje berre setjas opp!)
Vi har at X1 , . . . , Xn er u.i.f. N(µ1 , σ02 ) og at Y1 , . . . , Ym er u.i.f. N(µ2 , σ02 ), og også at alle
Xi -ane er uavhengige av alle Yj -ane, i = 1, . . . , n, j = 1, . . . , m. Forventningsverdiane µ1 og
µ2 er ukjende, medan variansen σ02 er felles og kjend.
Naturleg estimator: µˆ1 − µˆ2 = X̄ − Ȳ
Då estimatoren er ein lineærkombinasjon av uavhengige normalfordelte variable er han sjølv
normalfordelt med:
E(µˆ1 − µˆ2 ) = E(X̄) − E(Ȳ ) = µ1 − µ2
σ2 σ2
Var(µˆ1 − µˆ2 ) = Var(X̄) + Var(Ȳ ) = 0 + 0 .
n
m
ov9-lsf-b
25. mars 2015
Side 4
TMA4245 Statistikk
Vår 2015
D.v.s:
X̄ − Ȳ − (µ1 − µ2 )
q
∼ N(0, 1)
1
σ0 n1 + m
som gjev:

P

X̄ − Ȳ − (µ1 − µ2 )
q
P −z α2 ≤
≤ z α2  = 1 − α
1
1
σ0 n + m
!
r
r
1
1
1
1
X̄ − Ȳ − z α2 σ0
+
≤ µ1 − µ2 ≤ X̄ − Ȳ + z α2 σ0
+
= 1−α
n m
n m
D.v.s. at vi får (1 − α)100% konfidensintervall ved:
"
r
X̄ − Ȳ − z α2 σ0
1
1
+ , X̄ − Ȳ + z α2 σ0
n m
r
1
1
+
n m
#
For å få numerisk svar set vi inn talverdiane: x̄ = 28.80, ȳ = 26.07, σ0 = 2, m = n = 10 og
z0.025 = 1.96. Får då eit 95%-konfidensintervall på:
[0.977, 4.483]
Oppgave 4
a) T ∼ eksp( µz )
µ
z
E(T ) =
µ = 1000, z = 2.0
R 1000 z − z x
R
µ dx = 1000
P (T ≤ 1000) = 0
µe
0
P (T ≤ 1000) = 0.5
e−z
= 0.5
z1 = 1.0,
⇔
⇔
1 − e−
1000z
1000
x
1 − 500
dx
e
500
x
= [−e− 500 ]1000
= 1 − e−2 = 0.86
0
= 0.5
z = − ln 0.5 = 0.69
z2 = 2.0
P (T2 ≥ T1 ) =?
Finner simultanfordelingen til T1 og T2 :
f (t1 , t2 ) =
z1
z2
z1 − µ t1 z2 − µ t2
e
e
µ
µ
Z
siden T1 og T2 er uavhengige.
∞Z ∞
P (T2 ≥ T1 ) =
f (t1 , t2 )dt2 dt1 =
0
=
=
ov9-lsf-b
z1 z2
µ2
Z t1∞
0
z
z
− µ1 t1 − µ2 t2 ∞
]t1 dt1
[− zµ2 e
µ
z1
µ [− z1 +z2 e
z1 z2
µ2
−(
z1 +z2
µ )t1 ]∞
0
=
25. mars 2015
∞Z ∞
Z
0
=
z1
z1 +z2
t1
z1 z2 µ
µ 2 z2
=
z
z
− µ1 t1 − µ2 t2
e
dt
e
Z
1.0
1.0+2.0
∞
2 dt1
z
z
− µ1 t1 − µ2 t1
dt1
e
0
=
1
3
Side 5
TMA4245 Statistikk
Vår 2015
b) SME for µ:
zi
zi − µ ti
e
i=1 µ
Qn zi − zi ti
L(µ; t1 , . . . , tn , z1 , . . . , zn ) = i=1 µ e µ
P
P
l(µ) = ln L(µ) = ni=1 ln zi − n ln µ − ni=1 zµi ti
Pn zi ti
∂l
n
i=1 µ2 = 0
∂µ = − µ +
Pn zi ti
n = i=1 µ
P
P
µ = n1 ni=1 zi ti Dermed er SME µ
b = n1 ni=1 zi Ti .
Qn
f (t1 , . . . , tn ; µ, z1 , . . . , zn ) =
E(b
µ) =
n
X
E( n1
zi Ti ) =
n
X
1
n
i=1
zi E(Ti ) =
i=1
1
n
n
X
zi zµi
=
1
n
i=1
n
X
µ=µ
i=1
Dvs. estimatoren er forventningsrett.
Var(µ̂) =
Var( n1
n
X
zi Ti ) =
1
n2
i=1
1
n2
=
n
X
i=1
c) MGF for Ti : MTi (t) =
V =
2nb
µ
µ
=
2
M 2zi (t) =
µ Ti
MV (t) =
Pn
i=1 zi Ti
µ
zi
µ
zi 2zi
−
µ
µ t
Qn
(Bruker at
zi
µ
zi
µ −t
=
n
X
Var(zi Ti ) =
i=1
2
zi2 µz 2 =
i
1
n2
n
X
µ2 =
1
n2
n
X
zi2 Var(Ti )
i=1
µ2
n
i=1
(Funnet i tabell.)
Pn
2zi
i=1 µ Ti
= (1 − 2t)−1 (Bruker at MaX (t) = MX (at))
− 2t)−1 = (1 − 2t)−n
Q
(t) = ni=1 MXi (t))
i=1 Xi
i=1 (1
MPn
(1 − 2t)−n er MGF for kji-kvadratfordelingen med 2n frihetsgrader. V har samme MGF
som kji-kvadratfordelingen med 2n frihetsgrader, derfor er V ∼ χ22n .
d) (1 − α)100% konfidensintervall for µ:
Bruker at V =
2nb
µ
µ
∼ χ22n .
P (z1−α/2,2n ≤ V ≤ zα/2,2n ) = 1 − α
µ
P (z1−α/2,2n ≤ 2nb
µ ≤ zα/2,2n ) = 1 − α
z1−α/2,2n
zα/2,2n
P(
≤ µ1 ≤
≤ µ1 ) = 1 − α
2nb
µ
2nb
µ
2nb
µ
2nb
µ
P(
≤µ≤
)=1−α
zα/2,2n
z1−α/2,2n
Det gir konfidensintervallet [ z 2nbµ , z
α/2,2n
ov9-lsf-b
2nb
µ
1−α/2,2n
]
25. mars 2015
Side 6
TMA4245 Statistikk
Vår 2015
α = 0.10, n = 10, µ
b = 1270.38
z1−α/2,2n = z0.95,20 = 10.85, zα/2,2n = z0.05,20 = 31.41
Innsatt disse tallverdiene blir konfidensintervallet [808.90, 2341.71]
ov9-lsf-b
25. mars 2015
Side 7