Konfidens- og prediksjonsintervall

Konfidens- og prediksjonsintervall
Utledning av formlene for konfidens- og prediksjonsintervall i lineær regresjon
inngår normalt ikke det første året innen studieretning statistikk ved universitetet,
og her vil jeg bare benytte meg av resultatene. Konfidensintervallet henspiller på
våre estimater av parameterne i populasjonen. Dersom det er snakk om et 95%
konfidensintervall, vil intervallene til 95 av 100 prøver i snitt inneholde
populasjonsverdiene. 𝒂 𝑜𝑔 𝒃 er våre estimater på populasjonens 𝜶 𝑜𝑔 𝜷. Så
konfidensintervallet forteller oss noe om hvor sikre vi kan være på at
regresjonslinjen er riktig. Regresjonslinjen gir oss forventet y-verdi og har
konfidensintervallet:
De fleste y-verdiene ligger jo ikke på regresjonslinja, men spredt rundt den. Når vi
skal prøve å forutsi (predikere) en y-verdi for en gitt x-verdi, må denne usikkerheten
tas med. Det beste vi kan gjøre er å tippe på forventet y-verdi (regresjonslina), men
usikkerheten er større for predikert y enn for forventet y. Prediksjonsintervallet til
en y er gitt ved:
Ola Lie
Side 1 av 2
Når du skal lage verktøy i GeoGebra, viser jeg igjen til Tor Espen Kristensens bok
(Kap. 12 Egne verktøy, side 97-100). Framgangsmåten er rimelig enkel. Etter at du er
ferdig med en konstruksjon, velger du Lag nytt verktøy fra menylinja. Deretter blir
du spurt om å angi start- og sluttobjekt. Det er stort sett det hele. Jeg har laget et
verktøy som tegner inn konfidensintervallet (rosa) og prediksjonsintervallet
(lyseblått) til en lineær regresjon.
Startobjektet er en liste. Hvis du vil ha et dynamisk intervall, kan du lage en glider og
oppgi denne. Hvis ikke, angir du bare tallet for konfidensintervallet. Fargene
kommer ikke automatisk fram så du må vise ulikhetene for å se dem.
Ola Lie
Side 2 av 2