Download Report

NTNU
Norges teknisk-naturvitenskapelige universitet
Institutt for sosiologi og statsvitenskap
SENSORVEILEDNING I SOS1002
SAMFUNNSVITENSKAPELIG FORSKNINGSMETODE
Eksamensdato: 28. mai 2010
Eksamenstid: 5 timer
Studiepoeng: 15
Antall sider bokmål: 2 (Formler: se side 7)
Antall sider nynorsk: 2 (Formler: se side 7)
Number of pages in English: 2 (Formulas: page 7)
Tillatte hjelpemiddel: Kalkulator (alle typer)
Sensurdato: 18. juni 2010
Faglig kontakt under eksamen: Arild Blekesaune (73 59 17 54)
Sensurtelefon: 815 48014
__________________________________________________________________________
BOKMÅL
Alle de tre oppgavene skal besvares.
De tre oppgavene teller hver en tredjedel av den samlede karakteren.
Oppgave 1
På neste side ser du en tabell med to regresjonsmodeller basert på data fra den norske delen av
”European Social Survey” fra årene 2002, 2004, 2006 og 2008. Utvalget skal behandles som
et sannsynlighetsutvalg fra populasjonen, hvor alle respondentene er personer på 15 år og
eldre som var bosatt i Norge. Den avhengige variabelen nettbruk måler svarene på spørsmålet:
”Hvor ofte bruker du Internett, World Wide Web eller e-post til privat bruk, enten hjemme
eller på jobben?”. De opprinnelige svarkategoriene ”Har ikke nettilgang, verken hjemme eller
på jobben”, ”Bruker aldri”, ”Mindre enn en gang i måneden”, ”En gang i måneden”, ”Flere
ganger i måneden”, ”En gang i uken” og ”Flere ganger i uken” er slått sammen i en kategori
med verdien 0, mens de som har svart ”Hver dag” er kodet med verdien 1. Videre er
variabelen mann kodet med verdien 1 for menn og verdien 0 for kvinner, mens variabelen
alder er kodet i antall tiår med en desimal. Forklar hva tabell 1 viser.
1
Tabell 1. Internettbruk fordelt etter alder og kjønn (N=7095)
Mann (kvinne=0, mann=1)
Alder (antall 10-år)
Årstall (dummyer med 2002 som referanse)
År 2004
År 2006
År 2008
Alder kvadrert
Samspill
Mann*År 2004
Mann*År 2006
Mann*År 2008
Konstant
B
0,635
-0,662
0,616
1,180
1,767
2,725
Modell1
S.E.
p
0,059
0,000
0,019
0,000
OR
1,888
0,516
B
0,693
0,561
0,076
0,080
0,090
1,851
3,256
5,851
0,103
0,000
0,000
0,000
0,000
15,264
Modell 2
S.E.
p
0,100
0,000
0,100
0,000
OR
2,000
1,753
0,610
1,303
1,932
-0,127
0,107
0,113
0,128
0,011
0,000
0,000
0,000
0,000
1,841
3,681
6,906
0,881
0,028
-0,158
-0,139
0,025
0,151
0,161
0,181
0,233
0,855
0,325
0,441
0,914
1,028
0,854
0,870
1,026
B = logistiske regresjonskoeffisienter
S.E. = regresjonskoeffisientenes standardfeil
p = signifikanssannsynligheten
OR = oddsratioet er antilogaritmen av B (exp(B))
MÅL: Teste studentenes evne til å kunne beskrive det sosiale mønsteret som fremstilles i en
logistisk regresjonstabell, og teste ut om studenten klarer å bruke det de har lært av statistiske
beregninger til en slik tolkning.
Viktig informasjon til sensor:
I oppgaveteksten har det dessverre kommet inn en skrivefeil i tabell 1. OR for dummyen År
2004 er i tabellen oppgitt til å være 0,851, men den riktige verdien skal være 1,851. Alle fikk
muntlig beskjed om denne feilen i løpet av eksamenen, men det kan tenkes at noen løste
ferdig oppgaven før de fikk denne beskjeden. Vi bør derfor våre åpne for ulike tolkninger av
dette oddsratioet.
Informasjon for vurdering av løsninger:
I pensum (Ringdal 2007, kap. 18.8.5) og på forelesningene har vi presentert hvordan
logistiske regresjonskoeffisienter kan tolkes i tre skalaer: Logit-, odds-, og sannsynlighetsskalaer. Tolkninger i logitskalaen er som vanlig lineær regresjon, og her skal studentene
kunne avgjøre om de uavhengige variablene har statistisk signifikant effekt på den avhengige
variabelen og samtidig kunne tolke om koeffisientene er positive eller negative. Dette må
regnes som et minimumskrav for å få godkjent oppgaven. De studentene som i tillegg til dette
klarer å tolke ut substansiell informasjon ut fra koeffisientenes størrelse eller ut fra oddsratioer
bør få litt tillegg for dette. De studentene som i tillegg klarer å gi gode beskrivelser av
modellene basert på (1) at de setter opp riktige regresjonslikninger fra en eller begge
modellene, regner ut (2) predikerte logiter for sammenlignbare idealtyper basert på ulike
kombinasjoner av verdier på de uavhengige variablene, og (3) regner om dette til
sannsynligheter for å bruke internett daglig har oppnådd de målene som er realistisk på
SOS1002 og bør honoreres med god karakter.
Minimumskrav i tolkningen av modell 1:
Alle bør kunne se at det er en større andel blant menn enn blant kvinner som bruker internett
daglig. Videre bør alle kunne se at andelen som bruker internett daglig går ned med økende
alder, og at andelen som bruker internett har økt jevnt fra 2002 og fram til 2008.
I tillegg er det sannsynligvis noen som ser den kurvelineære alderseffekten i modell 2, og
noen klarer kanskje også å finne ut at knekkpunktet på alderskurven er 2,2 noe som da
2
tilsvarer 22 år. Det vi i så fall si at internettbruker øker fram til de blir 22 år, for så å avta
gradvis jo eldre de blir. Dette kan de enten finne ut ved å predikere logiter (L) for alle
aldersgruppene (noe som vil ta så mye tid at det neppe er noen som har gjort det), eller noen
få har kanskje fått med seg fra forelesningen eller den anbefalte tilleggslitteraturen (Thrane
2003) at knekkpunktet for kurven kan beregnes med formelen –b1/(2 x b2) som i dette tilfellet
blir -0,561/(2 x -0,127) = 2,22 som vil si 22,2 år.
En del vil sannsynligvis også forsøke å forklare samspillene i modell 2, men ettersom ingen
av disse er statistisk signifikante på 5%-nivået så er det viktigste funnet her at det ikke har
skjedd noen vesentlig endring i kjønnsmønsteret mellom 2002 og 2008. Det vil si at det alltid
har vært en større andel brukere blant menn enn blant kvinner som bruker internett daglig.
De som velger å kommentere tabellen med utgangspunkt i oddsratioer bør bruke
omregningsformelen for å regne OR om til prosentvise forskjeller i odds. For modell 1 blir
dette:
Oddsen for å bruke internett daglig for menn blir da 88,8 [100(OR-1)=100(1,888-1)=88,8]
prosent høyere enn for kvinner, og oddsen for å bruke internett daglig blir 47,4 [100(OR1)=100(0,516-1)=47,4] prosent lavere for hvert tiår. Dette betyr at nedganen i oddsen blir 4,7
prosent for hvert år. De som framhever at alderseffekten kun måler forskjeller mellom
aldersgrupper, og ikke sier noe om at vi bruker internett mindre jo eldre vi blir, bør belønnes
for dette.
De som også gir tilsvarende beskrivelser av modellen bør honoreres for dette.
De predikerte sannsynlighetene for å bruke internett daglig for en person på 20 år i 2002 blir
da ut i fra modell 1 slik:
Hvis personen er mann:
LMann 20 i 2002 = 2,725 + (0,635*1) + (-0,662*2) + (0,616*0) + (1,180*0) + (1,767*0) = 2,036
PredMann 20 i 2002 blir da: 1/(1+EKSP(-2,036) = 0,885 som vil si 88,5 prosent
Hvis personen er kvinne:
LKvinne 20 i 2002 = 2,725 + (0,635*0) + (-0,662*2) + (0,616*0) + (1,180*0) + (1,767*0) = 1,401
PredKvinne 20 i 2002 blir da: 1/(1+EKSP(-1,401) = 0,802 som vil si 80,2 prosent
De tilsvarende predikerte sannsynlighetene for å bruke internett daglig for en person på 20 år i
2008 blir da ut i fra modell 1 slik:
Hvis personen er mann:
LMann 20 i 2008 = 2,725 + (0,635*1) + (-0,662*2) + (0,616*0) + (1,180*0) + (1,767*1) = 3,803
PredMann 20 i 2008 blir da: 1/(1+EKSP(-3,803) = 0,978 som vil si 97,8 prosent
Hvis personen er kvinne:
LKvinne 20 i 2008 = 2,725 + (0,635*0) + (-0,662*2) + (0,616*0) + (1,180*0) + (1,767*1) = 3,168
PredKvinne 20 i 2008 blir da: 1/(1+EKSP(-3,168) = 0,960 som vil si 96 prosent
3
Oppgave 2
MÅL: Teste studentenes kjennskap til sentrale begrep i pensum.
Vurderingskriterier:
Seks av ni oppgaver skal besvares, og vi bør derfor kun vurdere seks svar også fra de som har
besvart alle spørsmålene. Hver besvarelse skal være på inntil ½ side, og det bør tilsi at de bør
skrive mer enn en kort definisjon på hvert begrep. Ved tidligere eksamener har vi kun gitt
begreper som står i begrepsdefinisjonene på side 459 til 474 i Ringdal 2007, men i denne
eksamensoppgaven har satt opp flere begrep som ikke defineres i denne lista. En del av
begrepene er også sammensatt av begrep i pensum, der sammensetningen sannsynligvis vil
være nye for kandidatene. I disse tilfellene forventer vi at kandidatene er i stand til å avklare
begrepene hvis de har utviklet en god forståelse av den metodiske begrepsbruken.
a) Multippel regresjonskoeffisient
Begrepet kan ha forvirret en del. I pensum skriver Ringdal om multippel
regresjonsanalyse i kapitlene 17 og 18, som vil si regresjonsmodeller med en yvariabel og minst to x-variabler. En regresjonskoeffisient er i følge Ringdals definisjon
(b1 viser endringen i Y når X endres med en måleenhet, kontrollert for de andre
variablene i modellen), og her viser den andre leddsetningen til den multiple modellen.
De som skal få full uttelling her må derfor både ha med det om endring i Y når vi
endrer på X, og at dette er endringen etter at vi har kontrollert for effektene av alle de
andre X-variabelen i regresjonsmodellen.
b) Deterministisk og ikke-deterministisk årsaksforklaring
Ringdals begrepsdefinisjon av årsaksforklaring er ”Består av en robust sammenheng
mellom X og Y som kan forklares gjennom en eller flere årsaksmekanismer. En
sammenheng er robust hvis årsaksrekkefølgen mellom X og Y er spesifisert, og
sammenhengen er kontrollert for andre relevante forklaringsvariabler”. I delkapittel
2.5.2 skriver Ringdal at ”Hempels modell har en rekke problemer. For det første
innebærer en generell lovmessighet en deterministisk sammenheng: Hvis X så alltid Y.
En mulighet til å gjøre modellen mer anvendelig er å erstatte den allmenngyldige
loven med en sannsynlighetsformulering: Hvis X så ofte Y” (s. 46). Ringdal bruker
determinismebegrepet flere ganger utover i boka, men han bruker ikke begrepet ”ikkedeterministisk” som er et begrep som er brukt i forelesningene for å klassifisere
sannsynlighetsformuleringer som kontrast til determinisme. De som ikke har fått med
seg dette bør likevel kunne klare å si noe om hva som ligger i begrepet deterministiske
årsaksforklaringer, og se at disse sjelden kan brukes i samfunnsfaglige
årsaksforklaringer.
c) Systematiske og tilfeldige utvalgsfeil
Disse begrepene er ikke satt opp i begrepslista til Ringdal, men problemer knyttet til
systematiske feilkilder drøftes i kapittel 15.5 i forbindelse med målefeil. På
forelesningene ble det lagt stor vekt på forskjellen mellom systematiske og tilfeldige
utvalgsfeil i forbindelse med teknikkene for sannsynlighetsutvelging, og målefeil har
også blitt behandlet på dataøvingene. Vi forventer derfor at alle klarer å resonnere seg
fram til at tilfeldige utvalgsfeil viser til skjevheter i utvalget som oppstår på grunn av
at enhetene i utvalget er tilfeldig trukket fra en populasjon, mens systematiske
4
utvalgsfeil viser til skjevheter som skyldes at enhetene i populasjonen har ulik
sannsynlighet for å bli trukket ut i utvalget. Det siste oppstod bl.a. da Literary Digest
Magazine brukte telefonkatalogen for å trekke et utvalg på 10 millioner amerikanske
velgere før presidentvalget i 1936. Da fikk de på grunn av at republikanske velgere var
overrepresentert blant de som hadde telefon et utvalg som bestod av flere som stemte
på den republikanske presidentkandidaten enn den demokratiske.
d) Kjikvadratfordelingen
Ringdals begrepsdefinisjon: Sannsynlighetsfordeling for kjikvadratet (χ2).
Her er vi ut etter forståelsen av hva en sannsynlighetsfordeling er, og ikke ute etter en
beskrivelse av hvordan vi gjennomfører en kjikvadrattest.
e) Tosidig test
Ringdals begrepsdefinisjon: Statistisk test der nullhypotesen forkastes både ved høye
og lave verdier av testobservatoren.
Dette er den normale testen når vi benytter 1,96 som kritisk verdi i forhold til en
normalfordeling og t-fordeling. I regresjonsanalyse forkaster vi for eksempel H0 både
når t er større en 1,96 og når t er mindre enn -1,96.
f) Konfidensintervall
Ringdals begrepsdefinisjon: Et intervall rundt den estimerte verdi av en parameter der
vi med stor (95 %) sikkerhet kan si at den sanne verdien befinner seg.
På forelesningene er det blant annet vist hvordan den norske gaupebestanden vinteren
2006-2007 var estimert til 424 individer ± 15, som vil si et estimat i et
konfidensintervall mellom 409 og 439.
g) Samspillseffekt
Ringdals begrepsdefinisjon: Effekt av en x-variabel er betinget av en annen X, for
eksempel at effekten av utdanning på timelønn er sterkere for menn enn for kvinner.
Eksempelet i Ringdals definisjon er detaljert gjennomgått på forelesningene, og er et
sentralt eksempel i Ringdals gjennomgang av samspill på sidene 391 til 394.
h) Forklar og illustrer forskjellen mellom sentraltendens og spredning. Navngi to mål
på sentraltendens og to mål på spredning.
På forelesningene har vi lagt mest vekt på sentraltendensmålene modus, median og
gjennomsnitt, og de tilhørende spredningsmålene modalprosent, variasjonsbredde og
standardavvik. Ringdal har dette som hovedtema i kapittel 12.
i) Når skal man bruke korrelasjonsmålet tau-c, og når skal man bruke Cramers V?
Forklar forskjellen mellom disse målene.
Ringdals begrepsdefinisjoner:
5
Tau-c: Korrelasjonsmål beregnet på ordinale variabler, som også fungerer selv om det
er sammenfallende ranger.
Cramers V: Et korrelasjonsmål beregnet på å måle statistisk sammenheng mellom to
nominalvariabler i krysstabeller. Det er en normering av kjikvadratet (χ2).
I forelesningene har vi lagt vekt på at når vi velger korrelasjonsmål så tar vi hensyn til
målenivået på den av de to korrelerende variablene som har lavest målenivå. Vi velger
da Cramers V hvis minst en av variablene bør legges på nominalnivå, og tau-c hvis
begge variablene tilfredsstiller kravene til ordinalnivå. Vi kan likevel avvike fra denne
regelen hvis vi har to rangerbare variabler som ikke er lineære.
6
Oppgave 3
De sentrumsnære skolene og idrettslagene i Trondheim er bekymret for at studenter
"okkuperer" ballbinger og fotballbaner på kveldstid. Dette sliter på anleggene og fortrenger
yngre brukere. For å få mer informasjon om dette problemet går Trondheim kommune (TK)
og Studentsamskipnaden (SiT) sammen og engasjerer Trondheim Øst Forskningsfabrikk
(TØFF), hvor du er ansatt som forsker.
a) Du vil undersøke studenters opplevelse av disse nærmiljøressursene. Hva slags
metoder kan du bruke for å generere kvalitative data?
b) Du er usikker på hvor stort dette "okkupasjons"-problemet egentlig er og hvordan det
fortoner seg. Du ser for deg at du kan benytte observasjon for å få mer kunnskap.
Hvordan kan du gjøre dette og hva slags data kan du generere?
c) Hvordan kan du vurdere og redegjøre for kvaliteten av det arbeidet du har gjort?
d) Du finner ut at tilsvarende problemer finnes i Bergen. Beskriv 3 typer av
generalisering som du kan benytte for at også Bergen kommune kan kunne nyttiggjøre
seg resultatene dine?
MÅL: Få innsikt i studentenes kunnskaper og ferdigheter i kvalitative forskningsmetoder.
a)
Siden dette handler om OPPLEVELSE, er det sentralt at dybdeintervjuer tas med.
Observasjon og dokumenter (og eventuelt annet) kan også nevnes, men her er det sentralt at
man tenker konkret på hva det er man skal finne ut. I begrepet "generering" ligger det at data
skapes i den situasjon de samles inn.
b)
Observasjonsroller bør nevnes, og det er naturlig at man her ender opp med å anbefale én eller
annen form for deltakende observasjon. Et viktig spørsmål når man gjør observasjonsstudier
er å finne en rolle som er legitim på den plassen man skal observere. I de fleste situasjoner er
det ikke naturlig at forskere ”henger rundt” for å studere det som skjer. Sosiologen Erving
Goffman hadde en rolle som gymlærer i sitt studium av livet på mentalsykehus (1961) og fikk
på denne måten legitimert sin tilstedeværelse både i forhold til andre ansatte og pasientene.
Men ofte er det vanskelig å finne slike roller eller jobber som man kan gå inn i, og man er rett
og slett en observatør og ikke noe annet.
En av de første diskusjonene av roller under observasjon er presentert av Gold (1958). Han
redegjør for fire roller, fullstendig deltaker, observerende deltaker, deltakende observatør og
fullstendig observatør. Begge de fullstendige rollene er skjult observasjon, enten som deltaker
på linje med alle de andre eller som fullstendig utenfor situasjonen, for eksempel med oversyn
over et område. Observerende deltaker og deltakende observatør er begge åpne
observatørroller, hvor de observerte vet at forskeren er observatør (deltakende observatør)
eller at deltakeren også er forsker (observerende deltaker).
c)
Her det å diskutere pålitelighet og gyldighet. Ofte benyttes de tre kriteriene reliabilitet
(pålitelighet), validitet (gyldighet) og generaliserbarhet som indikatorer på kvalitet. I
kvalitativ forskning har man i noen grad snakket om troverdighet, bekreftbarhet og
overførbarhet (Thagaard 1998) som de tilsvarende tre indikatorer. Man kan godt oversette de
godt innarbeidede indikatorene til norsk, men å innføre nye begreper for det samme er lite
7
hensiktmessig. De norske begrepene pålitelighet, gyldighet og generaliserbarhet fungerer
utmerket godt som kriterier for kvaliteten på kvalitativ forskning.
Pålitelighet: Innenfor all type samfunnsforskning vil forskeren ha ett eller annet nivå av
engasjement i det tema det forskes på. Innenfor en positivistisk tradisjon er idealet nøytrale
eller objektive observatører. Forskerens engasjement i tematikken vil da kunne betraktes som
støy i prosjektet ved at det kan påvirke resultatene. Innenfor den fortolkende tradisjonen, som
kvalitativ forskning er basert på, har man innsett at en fullstendig nøytralitet ikke kan
eksistere. Her vil forskerens engasjement også kunne betraktes som støy, men også som en
ressurs. Det blir viktig å gjøre rede for hvordan ens egen posisjon kan komme til å prege
forskningsarbeidet. I en rekke prosjekter er det en forutsetning at forskeren har et spesielt
engasjement og særlig kunnskap om det området som studeres.
For å styrke prosjektets pålitelighet, eller reliabilitet, blir det viktig å reflektere over om man
har noe til felles med informantene, eller om man har spesiell kunnskap og engasjementet, og
hvordan slikt kan ha påvirket tilgang til feltet, utvalg, datainnsamling, analyse og resultater.
Mye kunnskap om det aktuelle temaet er en fordel for å stille presise spørsmål, men kan også
være en ulempe ved at man har med seg mange forutinntattheter. Som påpekt av Clive Seale
(1999) er det viktig at forskeren redegjør for hvilken informasjon som kommer gjennom
datainnsamling og hva som er forskerens egne analyser. Ved dybdeintervjuer gjør bruk av
diktafon det mulig for forskeren å legge fram direkte sitater, slik informantene la dem fram.
Dette vil kunne styrke troverdigheten til undersøkelsen fordi informantens ”stemme” gjøres
synlig i noen grad helt fram til leseren. Men det er da også viktig at det redegjøres for hvordan
sitatene er valgt ut: Hva representerer de i forhold til alt det informantene har sagt som ikke er
sitert? Teori vil kunne forme forskningen i større eller mindre grad. Når man formidler
resultater blir det viktig å redegjøre for hvordan perspektiver eller teorier har bidratt til å
forme forskningsdesign og analyse.
Hvordan informanter har blitt valgt ut, og knyttet til dette, hva slags relasjoner det er mellom
forsker og informanter, kan ha betydning for reliabiliteten. I noen sammenhenger kan det
være tette forbindelser mellom dem; kanskje var dette eneste mulighet til å kunne gjøre
forskning. I så fall blir det avgjørende å være åpen for disse relasjonene. Jeg mener at man
også innenfor kvalitative studier kan stille spørsmålet som man bruker for å teste reliabiliteten
i kvantitative studier: Ville resultatene blitt de samme dersom en annen forsker gjorde den
samme jobben? Man trenger ikke svare et klart ”ja” for høy reliabilitet, men redegjøre for
hvilke faktorer som kan peke i retning av at disse resultatene framkom fordi det var denne
forskeren og disse informantene som var involvert. Eller motsatt, redegjøre for hvorfor
resultatene ville ha blitt mye det samme om man forsøkte å gjøre prosjektet om igjen med
andre folk. Kort sagt, blir det viktig å fortelle om konteksten til undersøkelsen for å heve
reliabiliteten.
Gyldighet (validitet): Innenfor den kvantitative forskningstradisjonen har man fornorsket det
engelske ”validity” til validitet for å snakke om gyldighet (som jo faktisk er ”validity” på
norsk). Jeg foreslår derfor at den reelle, i stedet for Validitet betyr gyldighet. Når vi snakker
om validitet i forskningen tenker vi på om de svarene vi finner i forskningen faktisk er svar på
de spørsmål vi forsøker å stille. Innenfor en fortolkende tradisjon kan dette være en relativt
komplisert affære. Kvale (1997) foreslår at vi kan snakke om kommunikativ og pragmatisk
validitet, hvor den første testes i dialog med forskersamfunnet og den andre testes ved
spørsmålet om forskningen fører til endring eller forbedring. Innenfor samfunnsforskningen
vil sistnevnte form for validitet først og fremst være relevant for såkalt aksjonsforskning, hvor
8
forskning ses på som en form for demokratisk erkjennelsesprosess. Innenfor de fleste
samfunnsvitenskapene er det den kommunikative validiteten vi er opptatt av. Vi tester den i
dialog med forskersamfunnet, for eksempel på konferanser og ved publisering av resultater i
vitenskapelige tidsskrifter, men også ved at vi konstant forholder oss til tidligere relevant
forskning, aktuelle teorier og perspektiver. Vi kan styrke validiteten ved å være åpne på
hvordan vi praktiserer forskningen, ved å redegjøre for de valg vi tar, og ved å være sensitive
for hva som vesentlig innenfor tematikken vår, og om dette endrer seg.
Den viktigste sikringen for høy validitet er uansett at forskningen pågår innenfor rammene av
faglighet, forankret i relevant annen forskning. Dette betyr i praksis at vi forholder oss bevisst
til tidligere forskning som er gjort innenfor samme tema og/eller med samme metoder, ved at
vi sammenstiller våre funn med funn fra andres relaterte forskning og hva vi selv eventuelt
har konkludert med tidligere. Man kan innvende at dette kravet vil gjøre forskningen
konservativ, og det stemmer at forskningen nettopp er konservativ; den beveger seg med bitte
små skritt. Men disse små skrittene sikrer at forskning bygger på forskning for best mulig
validitet. Vi bør ikke forstå dette som at våre resultater bør s
d)

Ingen generalisering: (Vel, dette er jo ingen form for generalisering, men et
argument i dette henseendet.) Målet med et kvalitativt forskningsprosjekt kan være å
gå dypt inn i et spesifikt problemområde, hvor det situasjonsbestemte møtet mellom
forsker og informant (for eksempel i et dybdeintervju) eller informasjon knyttet til det
spesifikke caset, ikke lar seg, eller ikke er ønskelig å generalisere.

Naturalistisk generalisering: Man kan i rapporteringen av forskningen redegjøre
godt nok for detaljene i for eksempel et case, til at leseren selv kan vurdere hvorvidt
funnene vil ha gyldighet for eksempel for leserens eget case.

Moderat generalisering: Generalisering kan tenkes i en mer kvantitativ forstand,
hvor det er opp til forskeren å beskrive for hvilke situasjoner (tider, steder, kontekster
og andre variasjoner) resultatene vil kunne være gyldige.

Konseptuel generalisering: Man kan ved kvalitativ forskning utvikle konsepter,
typologier eller teorier som vil ha relevans for andre case enn det (eller dem) som er
studert.
Konseptuel generalisering er å anbefale for et induktivt studium.
9
Formler som kan komme til nytte:
(O  E) 2
Kjikvadratet:   
E
2
Pˆ 
1
der O er observert fordeling, og E er fordeling ved
statistisk uavhengighet
der P sannsynlighet og L er predikert logit (L = β0 + β1X1 + β2X2 + … + βkXk)
ˆ
1  e-L
Cramer V 
Kjikvadratet
N (k  1)
Kendalls Tau  c 
der k er antall kategorier i variabelen med færrest verdier
2k ( L  U )
n 2 (k  1) der L er par ordnet likt, og U er par ordnet ulikt
Kritiske verdier i normalfordelingen:
Kjikvadratfordelingen:
A n ta ll
fr ih e ts g r .
df
1
2
3
4
5
6
0 ,9 9
0 ,0 0 0 2
0 ,0 2
0 ,1 2
0 ,3 0
0 ,5 5
0 ,8 7
0 ,9 0
0 ,0 2
0 ,2 1
0 ,5 8
1 ,0 6
1 ,6 1
2 ,2 0
0 ,5 0
0 ,4 6
1 ,3 9
2 ,3 7
3 ,3 6
4 ,3 5
5 ,3 5
S a n n s y n lig h e t
0 ,2 0
0 ,1 0
1 ,6 4
2 ,7 1
3 ,2 2
4 ,6 1
4 ,6 4
6 ,2 5
5 ,9 9
7 ,7 8
7 ,2 9
9 ,2 4
8 ,5 6
1 0 ,6 5
0 ,0 5
3 ,8 4
5 ,9 9
7 ,8 2
9 ,4 9
1 1 ,0 7
1 2 ,5 9
0 ,0 2
5 ,4 1
7 ,8 2
9 ,8 4
1 1 ,6 7
1 3 ,3 9
1 5 ,0 3
0 ,0 1
6 ,6 4
9 ,2 1
1 1 ,3 4
1 3 ,2 8
1 5 ,0 9
1 6 ,8 1
0 ,0 0 1
1 0 ,8 3
1 3 ,8 2
1 6 ,2 7
1 8 ,4 7
2 0 ,5 2
2 2 ,4 6
10