Skriftlig eksamen i Økonomistyring

Det sociale helbred
- en sociologisk undersøgelse af social kapitals indflydelse på helbredet
Eksamensnumre: ( DDS: 848, kvant.: 1011), (DDS: 850, kvant. 1017), (DDS: 844, kvant.: 1044)
og (DDS: 849, kvant.: 1107)
Fag: Det danske samfund i sociologisk perspektiv og Kvantitative metoder
Underviser i DDS: Jørgen Elm Larsen
Vejleder i DDS: Hannah Heelund Madsen
Underviser i Kvantitative metoder: Lars Pico Geerdsen
Vejleder i Kvantitative metoder: Siri Dencker
Antal tegn med mellemrum: 119.920
Antal tegn i fodnoter med mellemrum: 852
Indholdsfortegnelse
1. Introduktion (848,1011), (850,1017), (844,1044), (849,1107) 1.1 Indledning og problemformulering 1.2 Læsevejledning 4 4 5 2. Helbredsbegrebet i et socialkonstruktivistisk perspektiv (848, 849) 2.1 Biomedicinen 2.2 Socialkonstruktivismen 2.3 Selvvurderet helbred 5 6 7 8 3. Social kapital (850, 848, 849) 3.1 Indledende om kapitalformerne 3.2 Definition af social kapital 3.3 Social reproduktion 3.4 Det sociale rum 3.5 Hverdagspraktikker 3.6 Social kapitals indflydelse på den enkeltes helbred 10 11 12 12 14 15 15 4. Teoretisk hypotese (844,1044) 17 5. Operationalisering (849,1107) 5.1 Helbred 5.2 Social kapital 17 17 18 6. Empirisk hypotese (848,1011) 20 7. Datapræsentation (1044) 7.2 Sammensætning af stikprøven 7.3 Bortfald 7.4 Bortfaldets sammensætning 20 21 22 22 8. Analysestrategi (1044) 8.1 Test af analysevariabler 8.2 Repræsentativitetstest 8.3 Test af empirisk hypotese 8.4 Test af bagvedliggende faktor 23 23 23 24 24 9. Statistisk teori (1011,1017) 9.1 Hvorfor statistik? 9.2 Stokastisk variabel 9.3 Sandsynlighedsmål 9.3.1 Simultan sandsynlighed 9.3.2 Marginal sandsynlighed 9.3.3 Betinget sandsynlighed 9.4 Uafhængighed 9.5 Beskrivende mål 9.5.1 Middelværdi 9.5.2 Varians 9.6 Fordelinger 9.6.1 Bernoullifordeling 9.6.2 Normalfordeling 24 25 25 26 26 26 26 27 27 27 28 28 28 28 2
9.7 Den standardiserede normalfordeling 9.8 Stikprøver og karakteristika ved stikprøver 9.8.1 En estimator for middelværdien 9.8.2 En estimator for variansen 9.9 Den centrale grænseværdisætning 29 30 30 31 31 10. Variabelpræsentation (1044) 10.1 Nære venskaber 10.1.2 Konfidensintervaller 10.2 Selvvurderet helbred 32 32 33 35 11. Repræsentativitetstest (1011,1017,1044,1107) 11.1 Opstilling af hypotesetest 11.2 Repræsentativitetstest for køn 11.3 Repræsentativitet for alder 11.3.1 P-­‐værdi 11.4 Repræsentativitetstest for indkomst 36 36 37 42 46 47 12. Test af empirisk hypotese (1011,1107) 12.1 χ2-­‐test for uafhængighed 12.2 Enkeltcelletest 52 52 57 13. Test af supplerende empirisk hypotese 13.2 Enkeltcelletest 59 63 14. Diskussion (848,850,844,849) 14.1 Empiriske resultater (848,1011),(850,1017),(844,1044),(849,1107) 14.2 Kausalitetsforhold mellem social kapital og helbred 14.3 Helbred som årsag til social eksklusion? 14.4 Helbred og refleksivitet i det senmoderne samfund 14.4.1. Sundhedsdiskurs og –politik i en dansk kontekst 65 65 67 68 69 71 15. Konklusion (848,1011), (850,1017), (844,1044), (849,1107) 72 16. Perspektivering (844,1044) 16.1 Adfærdsregulerende tiltag eller ej? 73 73 17. Litteraturliste 17.1 Bøger 17.2 Rapporter 17.3 Artikler 17.4 Internet 75 75 77 77 77 18. Bilag 18.1 Do-­‐file fra Stata 78 78 3
1. Introduktion
1.1 Indledning og problemformulering
Vi vil i denne opgave undersøge sammenhængen mellem social kapital og helbred.
Motivationen for at undersøge denne sammenhæng er en undren over, at vi i dag stadig oplever
social ulighed i helbredsniveauet i Danmark. Dette forekommer på trods af en række socialpolitiske
tiltag, der netop skal sikre alle danskere gode levekår. Et gratis offentligt sygehusvæsen lader ikke
alene til at kunne løfte denne opgave, idet der stadig forekommer højere dødelighed og mere sygdom blandt lavere socioøkonomiske grupper. En forebyggende og sundhedsfremmende indsats bliver da også mere og mere en del af det sundhedspolitiske arbejde.
Der findes en del forskning i forskellige forklaringsårsager til den sociale ulighed i det danske samfund. Man er nået til en erkendelse af, at der må andre midler til end alene økonomisk omfordeling
for at kunne sikre alle borgere en acceptabel levestandard. Den traditionelle sundhedsforskning har
hidtil været domineret og underlagt af det økonomiske og politiske magtfelt (Jensen et al 2007:25).
Men man kan anskue et paradigmeskrift i sundhedsforskningen, idet man har bevæget sig mere
imod at måle på individuelle faktorer så som venskabsrelationer og tillidsforhold frem for alene
økonomiske parametre og strukturer (Jensen et al. 2007:24). Vores baggrund for at undersøge sammenhængen mellem social kapital og helbred læner sig op ad de senere års sundhedsforskning.
Vi vil i denne opgave give et kritisk blik på den traditionelle forståelse af sundhed og helbred, og
belyse hvordan selvvurderet helbred på mange måder kan være væsentligt at inddrage, når man vil
beskrive menneskers helbredsniveau. Dernæst vil vi fokusere på hvorledes helbredet hos den enkelte kan ses i sammenhæng med Pierre Bourdieus begreb om social kapital. Vi tager fat i hans teori
om social reproduktion, og kan herved belyse hvorledes mekanismer skaber og opretholder ulighed
i helbredsniveauet. Dette udmønter sig i følgende problemformulering:
”Hvordan medvirker social kapital til at skabe ulighed i helbred?”
4
Med denne problemformulering ønsker vi således at finde en teoretisk og empirisk sammenhæng
mellem social kapital og helbred.
1.2 Læsevejledning
I det følgende vil vi redegøre for helbred i et socialkonstruktivistisk perspektiv samt for Bourdieus
reproduktions- og kapitalteori. Dernæst præsenteres den teoretiske hypotese, efterfulgt af en operationalisering af de teoretiske nøglebegreber, social kapital og helbred, der ligger til grund for den
fremadrettede analyse. Dette munder ud i udformningen af den empiriske hypotese. Vi gennemgår
da den grundlæggende statistiske teori, der danner basis for de tests, som vil blive foretaget i de
følgende afsnit; først af analysevariablerne, dernæst i repræsentativitetstesten og sidst i forbindelse
med vores statistiske test af sammenhængen mellem analysevariablerne. Der foretages desuden en
test for om indkomst også influerer på helbredet. Der konkluderes følgeligt på den empiriske analyses samlede resultater, som også i dette afsnit diskuteres. Derpå følger en diskussion af kausalitetsforholdet mellem analysevariablerne 'nære venskaber' og 'selvvurderet helbred'. I forlængelse heraf
præsenteres teori om social eksklusion, som underbygger en vekselvirkning mellem disse. Desuden
diskuteres opgavens teoretiske grundlag, Bourdieus reproduktions og -kapitalteori i forhold til teori
om den senmoderne individualisering og risiko, samt hvordan disse forskellige aspekter kan have
en indflydelse på sundhedspolitiske diskurser. Slutteligt konkluderes der samlet på opgaven og der
perspektiveres, med diskussionen som springbræt, til den sundhedspolitiske indsat i Danmark.
2. Helbredsbegrebet i et socialkonstruktivistisk perspektiv
I dagens Danmark er der, som bekendt, et stort politisk og mediemæssigt fokus på den danske befolknings generelle helbredsniveau. Derfor hører man også ofte begrebet helbred nævnt i medierne,
men hvad ligger der egentlig i dette begreb? I Politikens dansk ordbog defineres helbred som: ”En
persons fysiske tilstand med hensyn til at være sund og rask.” (Becker-Christensen et.al., 2007:
295). Denne ret brede definition dækker således over den enkeltes overordnede fysiske velbefindende. En person med et godt helbred er derfor én, der hverken lider af nogle synderlige sygdomme
eller fysiske skavanker. Det omvendte gør sig, som en logisk følge heraf, gældende for en person
med et dårligt helbred. Denne almene opfattelse af helbredsbegrebet er forholdsvis let at gå til, men
for at anskueliggøre hvordan helbredsbegrebet opfattes indenfor sociologien, er det vigtigt at forstå
begrebet i relation til biomedicinen. I det følgende vil vi derfor redegøre for, hvordan og hvorfor
sociologien har udviklet et helbredsbegreb, der står i kontrast til det biomedicinske. Redegørelsen
5
tager udgangspunkt i den socialkonstruktivistiske tekst The Sociology of Health and Illness af sociologen, Sarah Nettleton samt en undersøgelse af selvvurderet helbred foretaget af de to amerikanske forskere, Jana Mossey og Evelyn Shapiro.
2.1 Biomedicinen
Den såkaldte biomedicin er den fremherskende model indenfor den vestlige moderne lægevidenskab. Denne model bygger på fem grundantagelser; At kroppen og sindet kan behandles separat, at
kroppen kan repareres som en maskine, at teknologiske fortjenester overdrives således, at medicin
indoptager et teknologisk imperativ, at medicin er reduktionistisk, idet sygdomsforklaringer reduceres til biologiske forandringer, og at enhver sygdom er forårsaget af én sygdomsenhed. Disse fem
grundantagelser danner så at sige rammen om hele biomedicinen, der har været den samfundsmæssige diskurs i historiens løb i forhold til at forstå og forklare den menneskelige krop, sygdomme
samt helbredstilstande (Nettleton 2006:2). I de senere år er denne diskurs dog blevet voldsomt kritiseret af sociologien og samfundsvidenskaben i øvrigt. Denne kritik, der ligger i forlængelse af biomedicinens grundantagelser, tydeliggør kontrasten imellem biomedicinen og sociologiens helbredsopfattelser (Nettleton 2006:4).
Et sociologisk kritikpunkt af biomedicinen går på, at mennesket opfattes som et objekt frem for et
subjekt. Ved udelukkende at fokusere på de kropslige symptomer, opfattes patienten altså ikke som
et helt menneske. Ud fra et sociologisk perspektiv er dette problematisk, fordi der foruden en dehumanisering af mennesket samtidig er en risiko for, at biomedicinen overser karaktertræk hos patienten, der kan være af stor betydning for dennes helbred (Nettleton 2006:5f). I kritikken tydeligøres
også, at biomedicinen og sociologien har to ret forskellige opfattelser af den menneskelige krop.
Mens biomedicinen ser kroppen som en passiv anatomi, der skal kureres for sygdomme, ser sociologien kroppen som en del af et menneske, der interagerer i sociale relationer (Nettleton 2006:10).
Den biomedicinske model er baseret på en tydelig adskillelse mellem krop og psyke – det gælder
altså om at forstå sygdommen og ikke patienten (Kristensen 2002:18). En anden kritik går på, at
biomedicinen mere eller mindre bevidst overser faktorer, der indenfor sociologien opfattes som
værende altafgørende for den enkeltes helbred. Biomedicinen formår således ikke at forstå den
menneskelige krop i en større samfundsmæssig kontekst. Hermed negligeres økonomiske, kulturelle
og sociale faktorer, som ellers gentagende gange har vist sig at være afgørende for den enkeltes
6
livschancer. Helbred kan altså ifølge sociologien ikke udelukkende forstås ud fra den biomedicinske
model (Nettleton 2006:5).
2.2 Socialkonstruktivismen
Den vel nok mest dominerende retning indenfor sociologien, der beskæftiger sig med menneskets
helbred, er socialkonstruktivismen (Nettleton 2006:16). Som det er tilfældet med langt de fleste
teoretiske opfattelser, findes der også indenfor socialkonstruktivismen flere forskellige retninger og
varianter. Vi vil her redegøre for nogle af hovedtrækkene i teorien for at belyse helbredsbegrebet.
Socialkonstruktivisme er, som betegnelsen antyder, en opfattelse af, at mennesket lever i en konstrueret social virkelighed (Bredsdorff 2011:631). Det er teoriens påstand, at al viden og dermed
også den lægevidenskabelige, er samfundsskabt. Viden om sygdomme og helbredstilstande er ikke
givet på forhånd, idet den er et resultat af menneskelig forskning (Nettleton 2006:13). Sygdomme
skal derfor ifølge socialkonstruktivismen betragtes som biomedicinske fabrikationer frem for opdagelser af reelle naturgivne fænomener (Nettleton 2006:18). Heri ligger også den slet skjulte kritik af
det faktum, at biomedicinen ikke nødvendigvis har fundet frem til den endegyldige og objektive
sandhed om sygdomme og helbred – en opfattelse der ellers har været fremherskende tidligere (Nettleton, 2006:6;18).
Ifølge socialkonstruktivismen bør man analysere biomedicinen i dennes sociale, kulturelle og historiske kontekst, for at finde frem til de dominerende diskurser. Ingen diskurser er konstante størrelser, men er betinget af deres samtid. Den nuværende diskurs om helbred kan derfor meget vel forandres markant over tid (Nettleton 2006:15f;20f). Diskurserne indenfor biomedicinen kan desuden
være med til at reproducere de sociale strukturer i samfundet, hvis ikke de problematiseres (Nettleton 2006:23f). Socialkonstruktivismen retter hermed en skarp kritik imod biomedicinen for at problematisere dennes opfattelse af helbredsbegrebet.
I de senere år har der været en tendens til, at den ellers så stærke kontrast mellem biomedicinen og
sociologien, herunder socialkonstruktivismen, er blevet mindre udtalt. Dette skyldes til dels, at begge videnskaber har gjort nogle indrømmelser i forhold til hinanden. Dels er det et resultat af, at sygdommenes karakter samt samfundets reaktion herpå er ændret. Helt overordnet set er opmærksomheden både indenfor biomedicinen og sociologien rykket fra sygdomme til helbredstilstande. I dag
er der således et stigende fokus på de livstilsforebyggende og strukturelle faktorer, der har afgøren-
7
de betydning for menneskets helbred. For at tydeliggøre den forandring som sociologiens betragtninger om helbred har gennemgået, skelner man ofte mellem sociologien i biomedicinen og sociologien om biomedicinen. Sociologien i biomedicinen refererer til 1950’erne og 60’ernes sociologi,
hvor sociologer arbejdede på at finde svar på helbredsmæssige problematikker ud fra lægevidenskabelige interesser. Sociologien om biomedicinen henviser til den nutidige sociologi med socialkonstruktivismen i spidsen, der forholder sig mere kritisk til biomedicinen. Her er den enkeltes egen
opfattelse af sit helbred som udgangspunkt mindst lige så gyldig som den lægefaglige vurdering
heraf (Nettleton 2006:10ff).
Denne teoretiske tilgang eksemplificeres i det engelske sprog. Foruden det overordnede begreb
’sickness’ har man på engelsk to andre begreber for sygdom; ’disease’ og ’illness’. Det første begreb dækker over forskellige fysiologiske symptomer forårsaget af patologiske ændringer i kroppen, mens sidstnævnte referer til den enkeltes egen fortolkning af og reaktioner på disse symptomer. Groft stillet op kan man her sige, at biomedicinen fokuserer på ’dieseases’, mens sociologien
beskæftiger sig med ’illnesses’ (Nettleton 2006:13). Indenfor sociologien er der således en opfattelse af, at menneskets egen fortolkning af dets helbred er mindst lige så gyldig som den biomedicinske (Nettleton 2006:6). Man opererer her med begrebet selvvurderet helbred, som henviser til den
enkeltes egen vurdering af sit eget helbred.
2.3 Selvvurderet helbred
Der er to helt centrale forskelle mellem den biomedicinske model og den sociologiske samt socialkonstruktivistiske tilgang, hvor den førnævnte sociologiske kritik af biomedicinens dehumanisering
kommer til udtryk: For det første tager den biomedicinske model udgangspunkt i, hvad patienten
fejler, hvilket står i modsætning til, hvad selvvurderet helbred handler om – nemlig hvordan personen selv føler han eller hun har det (Kristensen 2002:19f). En anden væsentlig forskel mellem den
biomedicinske tilgang og det selvvurderede helbred er, at den biomedicinske model kun betragter
de medicinske diagnoser som ”objektive”, mens selvvurderet helbred anses for at være ”subjektivt”
(ibid.). Her står sociologien og den socialkonstruktivistiske tilgang igen i modsætning til biomedicinen: Menneskets egen tolkning af dets helbred anses, som nævnt, mindst ligeså gyldig som de
lægefaglige diagnoser. Der har ligefrem været en tendens til, at folk i højere grad tager kontrol over
deres eget helbred som en modreaktion på den øgede ekspertliggørelse af det menneskelige helbred
(Nettleton 2006:5). I de senere år har der imidlertid også været en tendens til, at lægevidenskaben
8
ikke længere udelukkende arbejder ud fra den biomedicinske model, men ligeledes anerkender og
tager patientens selvvurderede helbred i betragtning, når der skal stilles en diagnose (Nettleton
2006:21).
I 1982 publicerede forskerne, Jana Mossey og Evelyn Shapiro, en undersøgelse, der i dag bliver set
som en klassiker indenfor litteraturen om selvvurderet helbred. Mossey og Shapiro adspurgte i 1971
3.000 ældre mennesker på 65 år eller derover om, hvordan de ville vurdere deres helbred deres alder taget i betragtning. De fulgte herefter de medvirkende i seks år og kunne efterhånden se en klar
tendens blandt de adspurgte; Jo dårligere selvvurderet helbred i 1971, jo højere dødelighed i de efterfølgende seks år (Kristensen 2002:21). Mossey og Shapiro kunne altså påvise en sammenhæng
mellem det selvvurderede helbred og dødeligheden blandt de medvirkende. Selv ved kontrol for
socioøkonomiske faktorer såsom køn, alder og indkomst, gjorde denne sammenhæng sig stadig
gældende. De interviewede ”vidste” altså noget om deres helbred, selvom det ikke var understøttet
af en diagnose. Resultaterne fra Mossey og Shapiros undersøgelse ses i følgende søjlediagram:
Figur 2.1: Selvvurderet helbred og dødelighed. I diagrammet ses resultaterne fra de første 3 års opfølgning
af 3128 mennesker på 65 år eller derover (Kristensen 2002:21).
Det fremgår af figuren, at gruppen med dårligst selvvurderet helbred havde 2-3 gange så høj dødelighed som gruppen af medvirkende med ’fremragende’ helbred. Personer med ’fremragende’ selvvurderet helbred havde således også den laveste dødelighedsrate i undersøgelsen. Dette understøtter
9
undersøgelsens pointe: Det selvvurderede helbredsniveau passede med, hvordan dødeligheden i de
følgende år fordelte sig blandt de adspurgte.
Mossey og Shapiros undersøgelse af selvvurderet helbred er blevet forbillede for en – i dag –
omfattende forskning på området (Kristensen 2002:22). Senere forskning indenfor området har for
eksempel forsøgt at forklare, hvordan det selvvurderede helbredes skabes hos individet. Det ser ud
til, at individet samlet vurderer sit psykiske og somatiske helbred, og inddrager i denne forbindelse
både funktionsevne, lægelige diagnoser, symptomer og almindeligt velbefindende (Bjørner et al.
1996 i Kristensen 2002:22). Andre faktorer, der inddrages, er en række sociale og kulturelle forestillinger1 (ibid.). samt en vurdering af, hvad der er det ”normale” for en given alder (ibid.). En ældre person kan således vurdere sit helbred ’godt’ eller ’fremragende’, selvom vedkommende måske
lider af gangbesvær eller dårlig hørelse.
Sociologien og herunder socialkonstruktivismen reformulerer det traditionelle helbredsbegreb igennem en kritisk problematisering af biomedicinen. Den biomedicinske viden hævdes at være socialt
konstrueret og denne kan derfor ikke nødvendigvis betragtes som værende den endegyldige sandhed. Det sociologiske helbredsbegreb efterstræber at rumme alle de aspekter af det personlige og
det sociale, som opfattes som influerende på menneskets helbred samt oplevelsen heraf. Økonomiske, kulturelle og sociale faktorer må derfor ikke negligeres, når der er tale om helbred. Det selvvurderede helbred, forstået som den enkeltes egen fortolkning af sit helbred, er vægtet højt indenfor
sociologien efter Mossey og Shapiro publicerede undersøgelsen herom. Vi vil med afsæt i denne
redegørelse for det sociologiske helbredsbegreb introducere Pierre Bourdieus begreb om social kapital, som er vores teoretiske fokus for forståelsen af ulighed i danskerne helbredsniveau.
3. Social kapital
Begrebet ’social kapital’ er blevet defineret af flere teoretikere igennem det 20. århundrede. Disse
tæller blandt andre, James S. Coleman, Robert D. Putnam og Pierre Bourdieu. Vi har, som sagt,
valgt at tage udgangspunkt i sidstnævntes forståelse af begrebet, da vi med Bourdieus begreb kan
belyse væsentlige aspekter og årsagsforhold ved social ulighed og sætte dette i relation til helbredsforskelle i befolkningen. Den franske sociolog, Bourdieu, har med sin teori og empiriske arbejde
1
Der er nogle kulturelt bestemte forståelsesrammer (”schemata”), der er bestemmende for den måde, vi vurderer kropslige- og psykiske signaler.
10
synliggjort, hvordan social reproduktion finder sted i det moderne vestlige samfund. Vi vil her redegøre for denne teori ved først at introducere kapitalbegrebet med særlig fokus på social kapital.
Dernæst vil vi se på social reproduktion samt Bourdieus teori om sociale felter, sociale positioner,
agenters dispositioner (habitus) og positionering. Til sidst vil vi anskueliggøre, hvorfor dette er centralt for at forstå forskelle i menneskers helbred.
3.1 Indledende om kapitalformerne
Bourdieu synliggør med sit begrebsapparat nogle af de reproduktionsprocesser, der kan forklare
uligheder i menneskers levekår. Han introducerer et kapitalbegreb (Bourdieu 1986:241), der nuancerer og udvider det klassiske økonomiske kapitalbegreb og overskrider hermed den for Bourdieu
fuldstændig unaturlige grænse mellem økonomi og sociologi (Svendsen et al. 2006:27-28). Traditionelt set er kapital blevet defineret af Adam Smith som akkumuleret arbejde. Smith skelner mellem
fikseret og cirkulerende kapital – en definition som både, David Ricardo og Karl Marx, anerkender.
Fikseret kapital består af fire grupper: 1) maskiner og redskaber, som letter arbejdet; 2) bygninger;
3) landforbedringer; 4) tilegnede og nyttige egenskaber ved en person. Sidstnævnte er senere blevet
kaldt ’human kapital’. Cirkulerende kapital er den form for kapital, der skabes ved bytte (Svendsen
et al. 2006:28-29). Bourdieu betragter ligeledes kapital som akkumuleret arbejde i en materialiseret
eller kropsliggjort form (Bourdieu 1986:241).
Bourdieus kapitalbegreb omfatter økonomisk, kulturel og social kapital. Økonomisk kapital er direkte omvekslelig til penge eller er institutionaliseret i ejendomsrettigheder (Bourdieu 1986:243).
Kulturel kapital figurerer i tre former: Den kropsliggjorte (kropslige dispositioner), den objektiverede (i form af kulturelle goder såsom bøger og malerier) og den institutionaliserede (blandt andet
uddannelsesmæssige kvalifikationer) (ibid.). Social kapital er de ressourcer, der opnås gennem netværk. Dette vil blive beskrevet nærmere i det følgende afsnit. Den overordnede kapitalform hos
Bourdieu er den symbolske kapital, som er det, de førnævnte tre kapitalformer omformes til, når de
anerkendes indenfor et felt eller socialt rum (Järvinen 2007:365). Det er væsentligt at fremhæve, at
disse kapitalformer kan omveksles til hinanden (Bourdieu 1986:243), og at kapital, der er fikseret i
et medie kan overføres fra generation til generation (Svendsen et al. 2006:35). Individer – eller med
Bourdieus begreb agenter – overtager og viderefører tidligere akkumuleret historie (Jensen et al.
2007:31).
11
3.2 Definition af social kapital
Bourdieu introducerer begrebet social kapital i ”The Forms of Capital” fra 1986, hvori han skriver:
"The volume of the social capital possesed by a given agent thus depends on the size of the network
of connections he can effectively mobilize and on the volume of capital (economic, cultural and
symbolic) possesed in his own right by each of those to whom he is connected” (Bourdieu
1986:249).
Ved social kapital forstår Bourdieu den samlede mængde af ressourcer, aktuelle såvel som potentielle, som den enkelte opnår gennem de netværksrelationer eller grupper, vedkommende indgår i
(ibid.). Ens netværk består både af tilfældige relationer som for eksempel naboen og arbejdskollegaen samt af mere forudbestemte relationer som det netværk, man har igennem familien (Jensen et
al 2007.:33). I netværket eksisterer en række ressourcer, som den enkelte kan trække på. Der er således tale om ressourcer, som er til rådighed for alle gruppens medlemmer (Bourdieu 1986:249).
Herigennem skabes der en solidaritet mellem netværkets medlemmer (Bourdieu 1986:248). Social
kapital er modsat den økonomiske kapitalform ikke en kapitalform, der er synlig, men det betyder
dog ikke, at den ikke har synlige effekter (Svendsen et al. 2006:37).
Mængden af social kapital afhænger både af størrelsen af den enkeltes netværk og kvaliteten heraf.
Kvaliteten bestemmes af netværkets besiddelse af økonomisk, kulturel eller symbolsk kapital, som
det også fremgår af citatet øverst i afsnittet (Bourdieu 1986:249). Gennem netværket kan den enkelte opnå materielt og symbolsk udbytte, hvilket kan være afgørende for, hvordan den enkelte positionerer sig i samfundet. Social kapital er ikke en naturlig eller given størrelse, men er et resultat af
investeringsstrategier, der kan være bevidste såvel som ubevidste, kollektive såvel som individuelle
(Jensen et al. 2007:33). Der er tale om en evindelig indsats for at producere og reproducere holdbare, nyttige relationer, der kan sikre en materiel og symbolsk profit (Bourdieu 1986:249). Social kapital har desuden en række lighedspunkter med økonomisk kapital, idet Bourdieu betragter det som
noget, der kan investeres i og forrentes – man kan således vedligeholde og videreudvikle sin sociale
kapital (Jensen et al. 2007:33).
3.3 Social reproduktion
På trods af idealer om lighed og demokrati, er der stadig store levekårsmæssige forskelle på sociale
grupper i det vestlige samfund. Denne problematik belyser Bourdieu med sin teori om social repro-
12
duktion. Bourdieu bidrager til at forstå social ulighed ved at vise, hvordan der sker en differentiering mellem de mere og de mindre privilegerede i samfundet (Jensen et al. 2007:23) I forbindelse
med sin undersøgelse af det franske uddannelsessystem, beskriver han dette som en institution, der
helliger sig til en sikring af privilegier til de i forvejen privilegerede (Jørgensen 2003:43). Uddannelsessystemet reproducerer hermed klassesamfundet, idet skolen forudsætter en specifik kulturel
baggrundskapital for de studerende (Järvinen 2007:355). Der vil i undervisningssammenhæng altid
være et særligt indhold og sprog, som nogle har bedre forudsætninger for at forstå. Det samme gælder den måde, man eksaminerer og afholder prøver på (Jensen et al. 2007:35). Uddannelsessystemet
udøver på denne vis symbolsk vold.
Med symbolsk vold henviser Bourdieu til den måde hvorpå en dominerende gruppe mennesker og
deres virkelighed bliver til den objektive virkelighed. Det er en form for magtform, der er med til at
konstruere virkeligheden (Bourdieu 1996:40). Dette anser Bourdieu som en følge af en social fortrængning i alle sociale lag, hvorved magtrelationer mellem de dominerende og de dominerede er
objektiveret i rumlige og tingslige relationer, som mellem store godser og små lejelejligheder (Jensen et al. 2007:34). Langt mere magtfuld er den måde hvorpå den kultur, som man er født ind i,
opleves som den universelle kultur. Bourdieu beskriver, hvordan kulturen internaliseres i individet
og opleves som dén eneste kultur (ibid.). Dermed er de dominerede med til at undertrykke sig selv
ved ubevidst at acceptere en ’universel’ og arbitrær kultur (Jensen et al. 2007:35). Men hvem er så
de dominerende og de dominerede i vestens samfund, og hvordan er de positioneret i forhold til
hinanden i det sociale rum? Det har Bourdieu opstillet et skema for, som vi i det næste afsnit vil
uddybe.
13
3.4 Det sociale rum
Bourdieu har i ”Distinktionen” opstillet et skema kaldet ’rummet af sociale positioner og rummet af
livsstile’, som er både teoretisk og empirisk forankret. Skemaet, som ses nedenfor, tager udgangspunkt i de to dominerende differentieringsprincipper i det moderne samfund (Bourdieu 1994:21).
De er forskellene i økonomisk og kulturel kapital.
Figur 3.1 Pierre Bourdieu: ”Rummet af sociale positioner og rummet af livsstile”2
2 http://c-samf.systime.dk/typo3temp/pics/43b6c40822.png 14
Agenterne placeres i dette skema ud fra deres besiddelse af disse to kapitaler, og skemaet tydeliggør
da agenternes placering i forhold til hinanden. De rumlige afstande svarer til de sociale afstande
(ibid.), hvilket tydeliggøres gennem de to dimensioner i skemaet. For det første gennem den samlede mængde af kapital og for det andet gennem den relative mængde af henholdsvis økonomisk og
kulturel kapital. Hermed indtræder en afstand mellem agenterne i skemaet, der tilsvarer den sociale
afstand (ibid.). Rummet af sociale positioner angiver agenters positioneringer i samfundslivet. I
denne forbindelse er Bourdieus begreb om dispositioner eller habitus nødvendig for at forstå fordelingen i det sociale rum. Dette vil vi redegøre for i det følgende.
3.5 Hverdagspraktikker
Den position, agenten har i det sociale rum, er afgørende for agentens smagspræferencer og habitus.
Der skabes for agenten en livsstil, der udgøres af en række personvalg og valg af hverdagspraktikker. Bourdieu fremhæver, at samtidig med, at habitus er forskelliggjort i passiv forstand, idet den er
et produkt af forskellige positioner, er den tilmed aktivt forskelliggørende, idet den fører til en differentiering i praktikker (Bourdieu 1994:24). Med habitus forklarer Bourdieu, hvordan individ og
samfund sammen regulerer handling. Den samfundsmæssige praksis er nemlig inkorporeret i agenterne (Larsen 1999:75). Habitus er en disposition, der er overført gennem generationer uden at det
hverken anerkendes eller opleves sådan hos den enkelte (Jensen et al 2007:34). Habitus er et resultat af underliggende faktorer såsom adgang til kulturelle, uddannelsesmæssige, informationsmæssige, økonomiske og sociale ressourcer (ibid.). Med udgangspunkt i dispositioner og habitusbegrebet
kan man altså anskue hvorledes hverdagspraktikker mellem generationer og forskellige sociale positioner differentierer og reproduceres. Det er derfor en meget brugbar teori til at analysere forskelle
i helbred med.
3.6 Social kapitals indflydelse på den enkeltes helbred
En række studier taler for, at social kapital er af stor betydning for menneskers helbred. Det gælder
både studier af social kapital i form af den samlede mængde af tillid i et samfund (Diderichsen,
2011:359), og undersøgelser af sammenhængen mellem sociale relationer og helbred. Vi fokuserer
på sidstnævnte sammenhæng i tråd med Bourdieus begrebsapparat. Modtageligheden for sygdomme er således forøget hos personer med få sociale relationer og en ringe grad af følelsesmæssig støtte. Helbredelsen af disse sygdomme tager også ofte længere tid end hos personer med mange relati-
15
oner (Lund et al. 2002:98). Derudover ses mange og gode relationer som fremmende for den enkeltes sundhedsadfærd og velbefindende generelt (Lund et al. 2002:102f). I denne forbindelse kan vi
med Bourdieus teori forklare, hvordan den enkeltes sociale position er bestemmende for den enkeltes sundhedsadfærd.
Bourdieu beskriver, hvordan skelnen mellem det gode og det dårlige, det rigtige og det forkerte, det
fine og det vulgære, er forskellig fra agent til agent (Bourdieu 1994:24). Opfattelser af hvad der er
det sunde og usunde må derfor variere i forhold til agenternes sociale position. Hvad der et sted
opfattes som sundt, opfattes måske som usundt et andet sted. Der etableres en form for helbredskultur. For eksempel kan en agent være i et netværk, der har en bred viden om ”det sunde liv”, hvilket
kommer alle agenterne i dette netværk til gode. Men en agent kan også være i et netværk, hvor den
dominerende diskurs er decideret helbredsskadelig for eksempel i forhold til overdreven indtagelse
af fastfood, tobak, alkohol og andre rusmidler. Den enkeltes hverdagspraktik forankret i dennes
sociale kapital kan altså både være gavnlig og skadelig for helbredet.
Når man prøver at forstå sig på forskelle i helbred blandt mennesker, er Bourdieus teori derfor særlig relevant at inddrage. Det er en kendsgerning for sundhedsprofessionelle, at det er svært at ændre
på de uligheder, der er i helbredsniveauet hos forskellige sociale grupper. Bourdieu beskriver med
sit habitusbegreb, hvordan hverdagspraktikker er et resultat af sociale positioner, som den enkelte
agent har meget svært ved at ændre på grundet symbolsk vold. Hvis en agent for eksempel fra barns
ben har internaliseret en helbredsskadelig habitus, kræver en forandring først og fremmest, at agenten bliver opmærksom på sin skadelige habitus og dernæst arbejder hårdt på at ændre tingenes tilstand. Bourdieus teori om reproduktion fremhæver og tydeliggør hermed stabiliteten frem for forandringen i disse praktikker (Jensen et al:36). Med disse betragtninger kan vi nu formulere vores
teoretiske hypotese.
16
4. Teoretisk hypotese
Med udgangspunkt i den foregående redegørelse af helbredsbegrebet og Bourdieus reproduktionsteori med særlig vægt på social kapital, opstiller vi følgende teoretiske hypotese som genstand for
vores videre arbejde:
Social kapital Helbred Det er vores forventning, at vi ved behandling af det empiriske materiale, vil finde en tendens til, at
respondenter med meget social kapital, vil have et relativt bedre helbred, end de respondenter, der
besidder mindre social kapital. For at kunne applicere dette teoretiske udgangspunkt på vores empiri, vil vi i det følgende afsnit redegøre for operationaliseringen af de teoretiske begreber, vi beskæftiger os med. Dernæst vil vi i afsnit 6 udforme to empiriske hypoteser på baggrund af operationaliseringen, som vil være grundlaget for det statistiske arbejde med empirien.
5. Operationalisering
Vil vi i det følgende argumentere for, hvordan vi har valgt at operationalisere vores teoretiske begreber til målbare variable fra Levekårsundersøgelsen 2000. Denne proces kaldes operationaliseringen, og er et vigtigt skridt i en kvantitativ undersøgelse, idet den muliggør de empiriske test af vores
hypoteser. Dog er det ikke muligt at foretage en operationalisering, hvor man indfanger alle dimensionerne af de teoretiske begreber (Hansen et.al., 2009:21f). Kunsten består således i at bevare hovedessensen i begreberne, når disse omformes til empiriske variable, så man med rimelighed kan
sige, at operationaliseringen er valid (Hansen et. al., 2009:154f). Vi vil derfor i det følgende begrunde vores valg og fravalg med henvisning til de anvendte teorier.
5.1 Helbred
Økonomiske, kulturelle, sociale og personlige omstændigheder betragtes indenfor sociologien som
afgørende faktorer for den enkeltes helbred, som tidligere nævnt. I relation hertil opfattes den biomedicinske model, som er den mest udbredte indenfor den vestlige lægevidenskab, i mange hense-
17
ender som utilstrækkelig, idet den mere eller mindre bevidst negligerer denne samfundsmæssige
kontekst i en forståelse af helbredet (Nettleton 2006:5). Blandt socialkonstruktivistiske sociologer
vægtes den enkeltes selvvurderede helbred derfor som udgangspunkt mindst ligeså højt end den
lægefaglige vurdering heraf (Nettleton 2006:6;12). Der er desuden en generel tendens til, at den
enkelte tager mere ansvar for sit eget helbred (Nettleton 2006:5), samtidig med at lægevidenskaben
i højere grad inkluderer den enkeltes selvvurderede helbred i behandlingsforløbet (Nettleton
2006:21). En klassisk undersøgelse indenfor selvvurderet helbred, er lavet af forskerne, Mossey og
Shapiro. De har i deres undersøgelse fra 1982 påvist en klar sammenhæng mellem selvvurderet helbred hos ældre og dødeligheden blandt disse: Jo dårligere selvvurderet helbred de ældre havde i
1971, jo højere dødelighed var der blandt disse i de efterfølgende seks år (Kristensen 2002:21).Vi
har derfor valgt at operationalisere helbred til selvvurderet helbred, som det fremgår af følgende
figur:
Spørgmål 3: Helbred Hvordan vil De alt i alt vurdere Deres helbred? Selvvurderet helbred Vi antager, at denne variabel giver os et godt billede af den enkeltes overordnede fysiske og psykiske velbefindende, idet vi formoder, at respondenterne svarer ud fra deres umiddelbare opfattelse af
deres helbredstilstand. Respondenterne vil altså formodentlig ikke vurdere deres helbred godt, hvis
de for eksempel har psykiske problemer. Vi har derfor bevidst fravalgt de variable, der handler om
specifikke fysiske sygdomme og skavanker, idet vi ønsker at belyse det gennerelle helbredsniveau.
Desuden betyder dét, at spørgsmålet allerede stilles som nummer tre i spørgeskemaet, at vi stort set
undgår konteksteffekter. Besvarelserne er altså ikke umiddelbart påvirket af tidligere stillede
spørgsmål, hvilket alt andet lige også er af betydning (Hansen et. al. 2009:137f). I den videre undersøgelse refererer ’selvvurderet helbred’ derfor til, hvordan den enkelte alt i alt vurderer sit helbred.
5.2 Social kapital
Bourdieu definerer, som nævnt, social kapital som den samlede mængde af aktuelle og potentielle
ressourcer, som den enkelte besidder i kraft af de netværk, relationer og grupper, som vedkommen-
18
de indgår i (Bourdieu 1986:249). Med begrebet fremhæver Bourdieu, at såvel kvantiteten som kvaliteten af den sociale kapital er af betydning for den samlede kapitalmængde. Kvantiteten refererer
her til størrelsen på de netværk, som den enkelte besidder, mens kvaliteten henviser til dette netværks adgang til de øvrige kapitalformer. Det drejer sig derfor ikke kun om at have netværk, men
også om at have de rigtige netværk (Bourdieu 1986: 249). Ud fra en overvejelse om, at den enkeltes
helbred er mere influeret af kvaliteten end af kvantiteten af den sociale kapital, er det kvalitetsaspektet, vi vil belyse. I dag såvel som i år 2000, hvor Levekårsundersøgelsen stammer fra, er vi i
den danske velfærdsstat alle i teorien sikret en vis økonomisk levestandard. Vi antager hermed, at
sociale relationer i form af nære venskaber er af større betydning for den enkeltes helbred end den
samlede mængde af kapitalformer indenfor den enkeltes netværk. Vi har derfor valgt at operationalisere social kapital til ’nære venskaber’, som det fremgår af følgende figur:
Social kapital Spørgsmål 125: Har De nogen venner De kan tale med om personlige problemer? Nære venskaber Vi er af den overbevisning, at denne variabel indfanger de hovedtræk i Bourdieus sociale kapitalbegreb, der er relevante i forståelsen af den enkeltes helbred. Nære venskaber påvirker den enkeltes
oplevelse af at blive værdsat og have følelsesmæssig støtte, hvilket alt andet lige er af betydning for
dennes fysiske og psykiske velbefindende (Lund et.al 2002: 88). Dét, at have mindst én ven at kunne snakke med om personlige problemer, er altså afgørende i forståelsen af den enkeltes helbred.
Fremefter henviser ’nære venskaber’ således til den sociale kapital i forhold til hvorvidt den enkelte
har nogen venner at snakke med om personlige problemer.
19
6. Empirisk hypotese
På baggrund af operationaliseringen af helbred og social kapital opstiller vi følgende to empiriske
hypoteser, som tilsvarer vores teoretiske hypotese:
1. Hvis man ingen venner har at tale med om personlige problemer, medfører det et ringe
selvvurderet helbred.
Ingen nære venskaber Ringe selvvurderet helbred 2. Hvis man har venner at tale med om personlige problemer, medfører det et godt selvvurderet
helbred.
Nære venskaber Godt selvvurderet helbred I afsnit 12.1 og 12.2 afprøves disse hypoteser ved brug af statistiske tests. I det nedenstående indleder vi vores empiriske undersøgelse.
7. Datapræsentation
Den følgende analyse tager sit empiriske udgangspunkt i data indsamlet i forbindelse med Levekårsundersøgelsen i år 2000. Levekårsundersøgelsen er en prospektiv, longitudinel undersøgelse, der
senest er udført i år 2000 og desuden i henholdsvis 1986 og 1976. Undersøgelsen er foretaget ved
ansigt-til-ansigt interviews på baggrund af et struktureret spørgeskema, der søger at afdække for-
20
skellige aspekter af danskernes levekår; i undersøgelsen konkretiseret ved en række tematisk inddelte serier af spørgsmål omhandlede blandt andet helbred, deltagelse i sociale aktiviteter, tilgængelighed til materielle goder og så videre. Nedenfor ses en figur, der viser en induktiv analyse. Det
ses, at vi går fra en simpel tilfældig udvælgelse til en stikprøve. Vi foretager derefter en induktiv
analyse, det vil sige en analyse, hvor man ønsker at udtale sig om en population ud fra denne stikprøve:
Simpelt tilfældig udvælgelse Population Stikprøven Induktiv analyse Figur 7.1: Induktiv analyse
7.1 Populationen
I 1976 var undersøgelsens genstand den danske befolkning mellem 20 og 69 år, hvilket senere er
udvidet til at omfatte den danske befolkning fra 20 til 93 år (Andersen 2003:47)– grunden hertil er
at man har søgt at geninterviewe personerne fra den oprindelige stikprøve trukket i 1976, som i mellemtiden var blevet 24 år ældre. Vi kommer ind på mere herom i det følgende afsnit.
7.2 Sammensætning af stikprøven
I den oprindelige stikprøve fra 1976 blev respondenterne udtrukket ved hjælp af simpel, tilfældig
udvælgelse. I en bestræbelse på at geninterviewe respondenterne i de senere undersøgelser, har man
søgt at bevare den oprindelige stikprøve – for at sikre den oprindelige stikprøves fortsatte repræsentativitet, er der, grundet frafald af forskellig art, suppleret med nye respondenter. Tidsfaktoren, 24 år
21
fra første til seneste undersøgelse, har især resulteret i en mangelfuld repræsentation af den yngre
befolkning i den oprindelige stikprøve. Desuden er en andel af den oprindelige stikprøve faldet fra
som følge af dødsfald og en mindre andel grundet flytning af bopæl til udlandet. Stikprøven fra
2000 består således af to dele: 1. Længdesnitsstikprøve – gengangere fra den oprindelige stikprøve
og 2. tværsnitsstikprøve – supplerende udtræk med nye respondenter i aldersgruppen 20-42 år og et
mindre antal nye respondenter i aldersgruppen 42-93 år, udtrukket ved hjælp af stratificeret, tilfældig udvælgelse. Stikprøven består i alt af 7.602 respondenter (4.245 fra den oprindelige stikprøve,
3.357 suppleret), hvoraf der er opnået interviews med 4.981 (2.755 fra den oprindelige stikprøve,
2.226 suppleret), svarende til 2/3 eller 66%. Stikprøvens bortfald vil blive nærmere belyst i følgende afsnit.
7.3 Bortfald
Undersøgelsens bortfald er i år 2000 af en anseelig størrelse på 34%, mod henholdsvis 13% i 1976
og 17% i 1986. Dette kan givet skabe problemer for at opnå en tilfredsstillende svarprocent samlet
set, men i særdeleshed i forhold til undersøgelsens repræsentativitet af populationen. Er bortfaldet
af systematisk karakter, kan det medføre, at repræsentativiteten forringes i særlig grad, idet personer
med særlige karakteristika over- eller underrepræsenteres i analyseudvalget sammenlignet med populationen. Ie. et systematisk bortfald kompromitterer muligheden for at generalisere på basis af
undersøgelsens resultater. Des større et bortfald, des større effekt har den eventuelle systematiske
skævhed (Andersen et al. 2003:48).
7.4 Bortfaldets sammensætning
I alle de tre runder, hvor Levekårsundersøgelsen er udført, har nægtere været den mest væsentlige
årsag til bortfald – en tendens som skønnes at være stigende (Andersen 2003:49) I år 2000 var nægterprocenten således 23, mens det øvrige frafald skyldtes ”ikke truffet / bortrejst” i 6% af tilfældene
og ”sygdom, handicap mv.” i 5% af tilfældene. At de to sidste bortfaldskategorier er større end tidligere år tilskriver vi henholdsvis: 1) Fysisk mobilitet – siden 1976 er det blevet lettere og mere almindeligt at rejse, hvorfor folk vil være mindre tilbøjelige til at kunne træffes på deres bopæl. Desuden er stikprøven i 2000 suppleret med unge mennesker, som har en tendens til at flytte hyppigt,
hvilket gør dem mere vanskelige at komme i kontakt med. 2) At analyseudvalgets sammensætning i
2000 omfatter de aldrende respondenter fra den oprindelige stikprøve og således flere ældre end de
22
tidligere års stikprøver, hvorfor sygdoms- og handicapfaktoren spiller en mere væsentlig rolle
(ibid.).
8. Analysestrategi
I vores statistiske analyse af det empiriske materiale vil vi først præsentere vores udvalgte variable,
dernæst vil vi foretage en repræsentativitetstest for derefter at teste vores empiriske hypotese. Desuden vil vi til sidst undersøge om indkomst har en betydning for vores variabel ’selvvurderet helbred’. Til at teste disse forskellige elementer i materialet, anvender vi en række teststatistikker, som
i det følgende vil blive nærmere præsenteret.
8.1 Test af analysevariabler
Vi vil i forbindelse med vores analysevariabler foretage følgende test:
•
Opstilling af konfidensintervaller for den Bernoullifordelte variabel ’nære venskaber’
Vores analysevariabler består af information, som vi udelukkende er i besiddelse af for vores stikprøve. Vi er dog, ligesom i repræsentativitetstesten, interesserede i at sammenligne disse resultater
med populationen, for at få en idé om den statistiske usikkerhed forbundet med vores resultater. Vi
konstruerer derfor et konfidensinterval for ’nære venskaber’ og placerer vores stikprøves værdi i
forhold hertil.
8.2 Repræsentativitetstest
I repræsentativitetstesten foretager vi følgende tests:
•
En Z- test på den Bernoullifordelte variabel køn
•
En χ2-test på den kategoriserede variabel alder
•
En χ2test på den kategoriserede variabel indkomst
Vi beskæftiger os med variablerne alder, køn og indkomst, da disse i sociologisk teori betragtes som
grundlæggende differentierende faktorer i samfundet. Ved brug af tests undersøger vi, om der er et
systematisk bortfald på de tre udvalgte parametre. Vi benytter en Z-test til at vurdere om andelen af
mænd og kvinder er den samme i stikprøven og populationen. Dernæst opstiller vi to χ2-tests på
23
henholdsvis alder og indkomst, da vi er interesserede i at sammenligne stikprøvens og populationens fordelinger, for at kunne udtale os om der er repræsentativitet.
8.3 Test af empirisk hypotese
Til at afprøve vores empiriske hypotese foretager vi følgende tests:
•
χ2-test for uafhængighed mellem variablerne ’nære venskaber’ og ’selvvurderet helbred’
•
Enkeltcelletest af variablerne ’nære venskaber’ og ’selvvurderet helbred’
Vi tester først om der er uafhængighed mellem vores analysevariabler. Dernæst ser vi på, hvilke
kategorier, der er signifikant over- eller underrepræsenteret i forhold til vores H0-hypotese.
8.4 Test af bagvedliggende faktor
Vi tester om indkomst har en betydning for, hvordan respondenterne vurderer deres helbred. Dette
gør vi ved at foretage en χ2-test for uafhængighed og en enkeltcelletest mellem variablerne ’brutto
indkomst’ og ’selvvurderet helbred’.
Undervejs samles der op på testenes resultater og afslutningsvis sammenfattes de væsentligste pointer fra den samlede statistiske analyse.
9. Statistisk teori
Vi har nu præsenteret de empiriske hypoteser vi gerne vil teste ved hjælp af statistiske værktøjer, og
vi har præsenteret det datasæt, vi vil basere opgaven på. Med udgangspunktet i Levekårsundersøgelsen har vi en stikprøve, som vi vil bruge til at undersøge forhold, der kunne gøre sig gældende
for hele populationen. Derfor må vi først lave en repræsentativitetstest. Til en sådan test skal vi bruge nogle statistiske værktøjer, som vi vil redegøre for i det følgende.
24
9.1 Hvorfor statistik?
Statistik er et redskab, der kan bruges til at undersøge om vores teoretiske ideer kan påvises empirisk gennem de observationer, vi gør os i den virkelige verden3 (Malchow-Møller et al. 2010:17;54).
Statistisk teori fortæller os noget om sammenhængen mellem stikprøver og populationer. Det viser
sig, at tilfældigt udtaget stikprøver fordeler sig på en særlig måde, der kan beskrives ved hjælp af
statistikken. Ved brug af den viden kan vi finde frem til, om det analyseudvalg, vi behandler i denne
opgave, med en vis sandsynlighed kan fortælle os noget om hele population.
Men først er der noget mere basalt statistisk viden der må på plads. Det drejer sig om stokastiske
variable, deres sandsynlighedsfunktion samt nogle væsentlige sandsynlighedsmål. Med sandsynlighedsmålene kan vi senere beskrive, hvordan man statistisk kan påvise ikke-uafhængighed mellem
stokastiske variable, der er grundlæggende for at kunne teste for sammenhænge mellem vores variable. Vi vil også introducere beskrivende mål og relevante fordelinger for stokastiske variable. Afsnittet afsluttes med standardisering og den centrale grænseværdisætning inden vi endelig beskriver,
hvorledes disse statiske værktøjer kan fortælle os noget generelt om stikprøver.
9.2 Stokastisk variabel
En stokastisk variabel er en funktion, der forbinder en talværdi til ethvert udfald i udfaldsrummet,
Ω, af et eksperiment. En stokastisk variabel kan repræsentere mange forskellige hændelser med et
enkelt symbol, og disse er nyttige, når der skal undersøges sammenhænge, der involverer usikkerhed (Malchow-Møller et al 2010:75). Ved brug af stokastiske variable kan vi benytte os af, at deres
værdier svarer til sandsynligheder (Malchow-Møller et al. 2010:78). En stokastisk variabel betegnes
med store bogstaver, mens specifikke værdier betegnes med små (Malchow-Møller et al. 2010:76).
Man skelner mellem to typer af stokastiske variable; diskrete og kontinuerte. En stokastisk variabel
er diskret, når der er et endeligt antal udfald i et eksperiment. Man kan opskrive en sandsynlighedsfunktion
, der angiver sandsynligheden for at en stokastisk variabel, X, antager en
given værdi x (Malchow-Møller et al. 2010:79). Derimod har en kontinuert stokastisk variabel uendeligt mange udfald og kan derfor antage uendeligt mange værdier med uendeligt mange decimaler
(Malchow-Møller et al. 2010:77f). De variable, vi arbejder med, er alle diskrete, mens stikprøverne
er kontinuerte, hvilket vi vil uddybe senere.
3
Man sondrer i statistik mellem virkelige populationer og superpopulationer. Når vi skriver i den virkelige verden,
henviser vi til, at vi vil undersøge noget om en virkelig population. Det vil sige en population, der reelt eksisterer i modsætning til en superpopulation, der er et mere abstrakt begreb.
25
9.3 Sandsynlighedsmål
Med de stokastiske variable kan vi sige noget om sammenhænge i sociologiske problemstillinger.
Vi benytter os af statistiske redskaber, hvor vi arbejder med to eller flere stokastiske variable, der
repræsenterer de sociologiske aspekter, vi er interesseret i at undersøge om der er en sammenhæng
imellem (Malchow-Møller et al. 2010:84). I det følgende vil vi redegøre for forskellige sandsynlighedsmål, som er relevante i forhold til vores analyse.
9.3.1 Simultan sandsynlighed
Simultane sandsynligheder kan bruges til at belyse ”både-og-sandsynligheder”. Altså sandsynligheden for, at en bestemt værdi af den stokastiske variabel, X, og en bestemt værdi af den stokastiske
variabel, Y, indtræffer samtidig:
(Malchow-Møller et al. 2010:84).
9.3.2 Marginal sandsynlighed
Med de marginale sandsynligheder kan vi finde, hvad sandsynligheden er for en bestemt værdi den
stokastiske variabel X antager uafhængigt af, hvilken værdi Y antager. Man finder den marginale
sandsynlighed ved at summere den simultane sandsynlighed over alle mulige y-værdier, hvor xværdien er fastholdt (Malchow-Møller et al. 2010:86):
NY
f X (x) = " f (x, y i ) = f (x, y1 ) + f (x, y 2 ) + ...+ f (x, y NY )
(
i=1
9.3.3 Betinget sandsynlighed
Sandsynligheden for at en given stokastisk variabel, X, betinget på en stokastisk variabel, Y, kaldes
!
den betingede sandsynlighed. Den betingede sandsynlighed kan man udregne ved at dividere den
simultane sandsynlighed med den marginale sandsynlighed:
f X Y (x y) =
!
f (x, y)
f Y (y)
(Malchow-Møller et al. 2010:87)
De ovenstående tre sandsynlighedsmål kan bruges til at afsløre, om der er uafhængighed mellem to
stokastiske variable, hvilket vi vil benytte os af i den statistiske analyse.
26
9.4 Uafhængighed
Uafhængighed betyder, at information om en stokastisk variabel, X, ikke ændrer på en anden stokastisk variabel, Y. Det er udgangspunktet for den senere χ2-test. To stokastiske variable er uafhængige, hvis det gælder, at:
for alle værdier af x og y, eller
for alle værdier af x og y
(Malchow-Møller et al. 2010:90-91).
Uafhængighed er et centralt statistisk begreb, når man skal se på en mulig sammenhæng mellem
flere hændelser og afgøre om sammenhængen er kausal (Malchow-Møller et al. 2010:69ff). Hvis en
sammenhæng er kausal betyder det, at én variabel påvirker en anden, for eksempel at mængden af
social kapital har en indvirkning på helbred. Det er dog vigtigt at pointere, at vi ikke statistisk kan
bestemme kausalitetsforholdet, dette kan kun gøres teoretisk. Vi kan med vores tests heller ikke
afgøre hvorvidt der er afhængighed, vi kan udelukkende be- eller afkræfte en uafhængighed. Testen
man bruger til dette formål er en X2-test, som vi senere i opgaven vil bruge til at teste for netop uafhængighed mellem vores variable.
9.5 Beskrivende mål
Momenter er i statistikkens verden beskrivende mål eller gennemsnitsbetragtninger. Det er altså
karakteristika ved vores variable (Malchow-Møller et al. 2010:103). Vi vil i det følgende gøre rede
for to udvalgte momenter for stokastiske variable, nemlig middelværdi og varians4 (MalchowMøller et al. 2010:104). De er udvalgt, da de er grundlæggende for at forstå principperne for vores
undersøgelse.
9.5.1 Middelværdi
Det mest kendte moment for en stokastisk variabel, X, er middelværdien – den forventede værdi,
der betegnes med det græske bogstav, µ eller E(X), (Malchow-Møller et al. 2010:106)
4
Ved brug af beskrivende mål for stokastiske variable kan man håndtere situationer, hvor der er usikkerhed involveret
27
9.5.2 Varians
Varians fortæller os, hvor meget værdierne spreder sig omkring middelværdien. Når man skal undersøge den forventede spredning omkring middelværdien bruger man varians, betegnet med, V(X)
eller σ,2 (Malchow-Møller et al. 2010::112).
9.6 Fordelinger
Stokastiske variable kan fordele sig på mange måder, men oftest finder man, at stokastiske variable
følger nogle bestemte fordelinger (Malchow-Møller et al. 2010:135). Vi vil i det følgende fremhæve
to fordelinger, der er relevante i forhold til vores opgave. Vi kan nemlig trække på denne viden, når
vi senere skal udtale os om vores stikprøve.
9.6.1 Bernoullifordeling
I tilfælde hvor en diskret stokastisk variabel kan antage to udfald, enten 1 (succes) eller 0 (fiasko),
da gælder, at P(X=1)=p og P(X=0)=(1-p)5. Man siger X er Bernoullifordelt med parameteren p:
X~Ber(p). En Bernoullifordeling har middelværdien E(X) = p og variansen V(X) = p·(1-p)
(Malchow-Møller et al. 2010:135ff). Et eksempel på en sådan fordeling er køn, hvilket vi kommer
nærmere ind på senere i opgaven.
9.6.2 Normalfordeling
En anden brugbar fordeling er normalfordelingen, da både estimatorer og teststatistikker er normalfordelt (Malchow-Mølleret al. 2010:148). Dette vil vi komme ind på i det efterfølgende afsnit om
stikprøver og deres karakteristika.
En kontinuert stokastisk variabel, der er normalfordelt opskrives således: X~N(µ,
) (Malchow-
Møller et al. 2010:149). En betingelse for, at en kontinuert stokastisk variabel, X, er normalfordelt,
er at den har følgende tæthedsfunktion:
f (x) =
1
2 ! ! !"
2
!e
1 x"µ 2
" !(
)
2 "
, hvor µ = E(X) er middelværdien og
= V(X) er variansen
(Malchow-Møller et al. 2010:148).
5
Dette gælder, da den samlede sandsynlighed (andel) for alle mulige udfald skal summe til 1
28
f(x) betegner her en tæthedsfunktion. Arealet af en tæthedsfunktion er lig 1, da den angiver den
samlede sum af sandsynligheder. Man kan dog ikke finde en given punktsandsynlighed – kun belyse hvor sandsynligt et givent areal er (Malchow-Møller et al. 2010:94). På figur 9.1 nedenfor ses
tæthedsfunktionen for en normalfordelt variabel, X.
Figur 9.1: Tæthedsfunktion
Som det fremgår af figur 9.1 angiver µ funktionens midtpunktet og
dens vidde. Imidlertid er det
ikke muligt at udregne arealet, også kaldet den kumulative sandsynlighedsfunktion, ved at integrere
denne tæthedsfunktion. I stedet kan man benytte sig af en standardiseret normalfordeling, da det for
denne er muligt at slå sandsynlighederne for funktionen op i en tabel (Malchow-Møller et al.
2010:149-50). Normalfordelingen bruges til at anskueliggøre, hvordan simple, tilfældige stikprøver
vil fordele sig omkring den sande middelværdi i populationen jf. den centrale grænseværdisætning,
som beskrives i afsnit 9.9.
9.7 Den standardiserede normalfordeling
Den standardiserede normalfordeling har middelværdi µ = 0 og varians
= 1. Den kumulative
sandsynlighedsfunktion betegnes !(z) med tæthedsfunktionen ! (z) , hvorom det det gælder:
! (z) ! P(Z " z) . Man siger, at Z er standardnormalfordelt, dvs. Z~N(0,1) (Malchow-Møller et al.
2010:150)Man kalder det en standardisering, når man ændrer en stokastisk variabel med middel-
29
værdi, µ, til en ny stokastisk variabel med middelværdi 0 og varians,
, til en ny stokastisk varia-
bel med varians 1. Hvis man har en stokastisk variabel, Y, med middelværdi E(Y) = µ og varians
V(Y) =
, kan denne standardiseres ved at benytte sig af: Z =
Y !µ
!
Z er da en stokastisk variabel med middelværdi E(Z) = 0 og varians V(Z)=1 (Malchow-Møller et al.
2010:150f). Det er et meget brugbart værktøj indenfor statistikken, da man ved hjælp af den fundne
Z-værdi kan finde den kumulative sandsynlighed. Dette fremgår af en tabeloversigt (MalchowMøller et al. 2010:434f).
Nu vil vi lade blikket falde på, hvad vi egentligt kan sige om en stikprøve. De foregående bemærkninger om normalfordelinger og standardisering er helt essentielle for at kunne forstå, hvordan man
statistisk kan sige noget generelt om stikprøver.
9.8 Stikprøver og karakteristika ved stikprøver
Når vi vil beskrive forhold, der gælder for en ukendt fordeling (populationen), bruger vi den viden,
at en simpel tilfældig stikprøve vil følge en normalfordeling, som beskrevet tidligere. Dermed kan
stikprøvens beskrivende mål give os et bud på de samme mål i den fordeling, vi egentligt er interesseret i. Dette kaldes at give et skøn eller en estimator. Vi introducerede tidligere i afsnittet middelværdi og varians, og disse to størrelser vil vi nu se nærmere på.
9.8.1 En estimator for middelværdien
Vi ønsker at give et skøn for den sande middelværdi, µ, i populationen. Til dette bruger vi en estimator. Det gælder, at estimatoren eller stikprøvegennemsnittet,
, er summen af de realiserede
værdier af X divideret med antallet af observationer, n (Malchow-Møller et al. 2010:225ff)6:
1 n
X = ! Xi
n i=1
6
Dette følger af stikprøveanalogprincippet, der bygger på, at et givet skøn inkluderer alle observationer
30
Stikprøvegennemsnittet er stokastisk eftersom variablerne er stokastiske, mens den sande middelværdi, µ, for populationen er en konstant. Ved at indsætte en realiseret stikprøve i formlen ovenfor,
1 n
finder vi det realiserede stikprøvegennemsnit. Dette er et estimat: x = ! xi (ibid.)
n i=1
Men hvordan ved man, om et givent estimat giver et godt bud på den sande værdi? Der gælder, at
hvis man udtrækker et antal simple tilfældige stikprøver, da vil de i gennemsnit ramme den sande
værdi, og dermed være et godt bud herpå. I det tilfælde kalder vi estimatoren central eller unbiased,
og der gælder, at E(
) = µ (Malchow-Møller et al. 2010:228). Man kan sige, at gennemsnittet af
gennemsnittene er lig med det sande gennemsnit. Men dette betyder imidlertid også, at det er muligt
at udtrække en stikprøve, der alligevel ligger langt fra den sande værdi, da denne stikprøve kun er
baseret på et udsnit af populationen (Malchow-Møller et al. 2010:228).
9.8.2 En estimator for variansen
Med samme udgangspunkt kan man opskrive variansen af stikprøvegennemsnittet,
tilfældig stikprøve som: V (X) =
, i en simpel
!2
, hvor ! 2 er variansen i fordelingen af interesse.
n
Det gælder for estimatoren X at når n à ! så vil E(X) à µ og V (X) à 0, og man siger estimatoren er konsistent. Hvis en estimator har en mindre varians end en anden, siger man, at den er mere
efficient (Malchow-Møller et al. 2010:229).
9.9 Den centrale grænseværdisætning
Den centrale grænseværdisætning er, som betegnelsen antyder, helt central inden for den statistiske
verden. Hvis vi antager, at vi har en simpel tilfældig stikprøve på n elementer, viser det sig, at uanset hvilken fordeling stikprøven følger, så vil stikprøvegennemsnittet approksimativt være normalfordelt omkring det sande populationsgennemsnit, så længe stikprøven er tilstrækkelig stor. Denne
vigtige pointe kalder man den centrale grænseværdisætning (Malchow-Møller et al. 2010:232), og
formlen ser ud som følgende:
X ~ A N(µ, ! 2 / n)
Formlen angiver hvordan et gennemsnit af stikprøver vil fordele sig approksimativt normalfordelt,
idet summen af middelværdierne er µ, og summen af varianserne er σ2/n (Malchow-Møller et al.
31
2010:232). Med denne bemærkning om den centrale grænseværdisætning kan vi nu udføre vores
repræsentativitetstest. De statistiske værktøjer vi skal bruge her og når vi skal teste vores hypotese
vil blive forklaret undervejs.
10. Variabelpræsentation
I det følgende vi vil præsentere de to variable vi har valgt, nemlig ’nære venskaber’ og ’selvvurderet helbred’. Vi vil fremlægge, hvordan vores givne analyseudvalg fordeler sig på disse variable.
Efter at have fjernet data om de respondenter, der ikke har svaret på blot en eller begge af vores
variable, har vi fundet et analyseudvalg på 4.973 personer. Vi har fjernet data i de tilfælde, hvor en
respondent enten ikke har ønsket at svare, har svaret ved-ikke eller af andre årsager er kodet som
enten ”uoplyst” eller ”missing”. Disse respondenter er ikke anvendelige for vores undersøgelse.
10.1 Nære venskaber
Jf. vores operationalisering af spørgsmålet: ”Har De nogle venner, De kan tale med om personlige
problemer?” gjort til udtryk for om hvorvidt man har ’nære venskaber’ eller ej. Vi finder, at 4.296
respondenter eller 86,39% har sagt ”ja” til dette, mens 677 respondenter eller 13,61% har svaret
”nej”. Tallene kan aflæses i tabellen nedenfor:
Nære venskaber
Frekvens
Procent
”Har De nogle venner, de kan tale med
om personlige problemer?”
Ja
Nære venskaber
4,296
86,39%
Nej
Ingen nære venskaber
677
13,61%
I alt
Både nære og ingen
4.973
100%
nære venskaber
Tabel 10.1: Data for variablen ’nære venskaber’. Tallene stammer fra Levekårsundersøgelsen år 2000.
’Nære venskaber’ er en binær variabel, idet man kun kan svare ’ja’ eller ’nej’, og den følger dermed
også en normal skala, da der ikke er nogen struktur eller sammenhæng mellem de to værdier
(Malchow-Møller et al. 2010:27). Det er en diskret stokastisk variabel, idet den der er tællelig, og
den følger en Bernoullifordeling, jf. det teoretiske afsnit 9.6.1. Vi vil nu opstille konfidensintervaller.
32
10.1.2 Konfidensintervaller
Konfidensintervaller er et statistisk værktøj, der gør os i stand til ud fra et stikprøvegennemsnit,
,
i en stikprøve at estimere et skøn i form af et interval, med en nedre og øvre grænse, inden for hvilket vi med en given sandsynlighed (1- α) kan sige, at en sand værdi, µ, i populationen befinder sig.
Konfidensintervallet afhænger af stikprøvens størrelse (Malchow-Møller et al. 2010:270f). Denne
type test gør sig således relevant i de tilfælde, hvor man er i besiddelse af en værdi for en stikprøve,
men ingen tilsvarende for populationen, og alligevel ønsker at udtale sig om i hvilken grad stikprøvens værdi kan siges at være repræsentativ for populationen. Konfidensintervaller benævnes matematisk:
Î = [Wned ;Wop ] (Malchow-Møller et. al 2010:270)
Hvor Wned betegner den nedre grænse for konfidensintervallet, og Wop betegner den øvre grænse.
Da stikprøven er simpelt tilfældigt udtrukket, er
(jf. den centrale grænseværdisætning afsnit 9.9)
en unbiased estimator for vores middelværdi. Den følger approksimativt en normalfordeling, når n
bliver stor. Derfor kan vi bruge denne til at konstruere et konfidensinterval, der fordeler sig symmetrisk omkring
. Det gør vi således:
Î = [X ! k; X + k] , hvor k er en positiv konstant, der i det følgende vil blive forklaret (ibid.).
Nu vil vi så bestemme den sandsynlighed (1- α) for hvilken den sande værdi befinder sig indenfor.
Indenfor sociologien er det normalt at acceptere en usikkerhed på 5%, derfor vil vi sætte α = 0,05.
Det vil betyde, at konfidensintervallet med 95 % sandsynlighed rummer den sande værdi, såfremt
stikprøven er repræsentativ. Som nævnt tidligere, følger stikprøvegennemsnittet den centrale grænseværdisætning, hvilket gør, at vi kan omskrive den til et standardiseret stikprøvegennemsnit, Z, der
approksimativt følger en standardnormalfordeling:
Z=
X !µ
2
! /n
~ A N(0,1) (Malchow-Møller et al 2010:272)
Med udgangspunkt i konfidensniveauet kan man opstille
Z a/2 og Z1!a/2 . Som det ses på figuren
nedenfor angiver disse øvre og nedre Z-værdi (ibid.).
33
Figur 10.2: Konfidensintervaller
2
Man finder, at k kan udtrykkes ved Z1!a/2 " ! / n , og dermed er formlen for konfidensintervallet:
Konfidensintervallet er således baseret på varians og stikprøvestørrelse, som tilsammen bestemmer
hvor bredt eller smalt et konfidensinterval, man har mulighed for at konstruere. I vores tilfælde,
hvor vi vil lave et konfindensinterval på ’nære venskaber’, er der tale om en Bernoullifordelt stokastisk variabel. Man kan i dette tilfælde simplificere formlen til:
hvor
er er andelen af de med ’nære venskaber’ stikprøven, n er antallet i stikprøven.
Vi finder Z1!a/2 =+/-1,96, idet vi har sat
a = 0, 05 . Vi indsætter værdierne fra tabel 10.1 og finder:
34
Dette betyder, at andelen af de med ’nære venskaber’ med 95% sandsynlighed ligger mellem
85,44% og 87,34%. Vores værdi er, som nævnt, 86,39%. Med dette konfidensinterval har vi mere
information om vores variabel, idet der er taget forbehold for usikkerhed.
10.2 Selvvurderet helbred
Selvvurderet helbred har vi operationaliseret på baggrund af spørgsmålet: ”Hvordan vil De i alt
vurdere Deres helbred?”. Som det ses af tabel 10.3 nedenfor har 1.998 respondenter eller 40,18%
svaret ’virkelig godt’, 1.992 eller 40,06% svaret ’godt’, 716 eller 14,40% svaret ’nogenlunde’, 204
eller 4,10% svaret ’dårligt’, mens 63 eller 1,27% svarede ’meget dårligt’.
Selvvurderet
Frekvens
Procent
Virkelig godt
1.998
40,18%
Godt
1.992
40,06%
Nogenlunde
716
14,40%
Dårligt
204
4,10%
Meget dårligt
63
1,27%
4.973
100%
helbred
”Hvordan vil De i alt vurdere
Deres helbred?”
I alt
Tabel 10.3: Data for variablen selvvurderet helbred
’Selvvurderet helbred’ følger en ordinal skala, idet værdierne er rangordnede. Derimod kan man
ikke vurdere størrelsen mellem værdierne (Malchow-Møller et al. 2010:27). Vi kunne vælge at opstille konfidensintervaller for hver kategori ved for eksempel at betragte ’godt’ i modsætning til alle
andre kategorier. I det tilfælde kunne vi betragte kategorierne som Bernoullifordelinger og opstille
konfidensintervaller. Men da et konfidensinterval vil være afhængig af de andre konfidensintervaller, idet andelene i hver kategori samlet skal summe til 1 har vi vurderet, at vi ikke kan konkludere
noget entydigt om vores variabel ved at gøre dette.
35
11. Repræsentativitetstest
Når man tager udgangspunkt i en stikprøve fra en population, vil den altid være forbundet med en
vis usikkerhed. Nu vil vi derfor teste, om vores stikprøve overhovedet er repræsentativ med hensyn
til køn, alder og indkomst. Disse tre parametre er udvalgt, da de indenfor sociologien står som nogle
af de centrale årsager til social differentiering. Hvis der forekommer en skævhed i en eller flere af
disse repræsentativitetstest, kan det influere på de statistiske test af vores empiriske hypotese. I det
næste afsnit vil vi således teste, om der er tale om signifikante forskelle mellem vores stikprøve og
populationen. Viden om populationen er hentet fra Danmarks Statistik. Inden vi udfører de egentlige tests, vil vi først præsentere noget generel teori om hypotesetest.
11.1 Opstilling af hypotesetest
Man kan ikke umiddelbart være sikker på, at den stikprøve, man har udtrukket, bekræfter ens teoretiske hypotese. Derfor opstiller man to statistiske hypoteser; én der bekræfter teorien og én der afkræfter den. Derudover opstiller man en beslutningsregel, som er bestemmende for, hvornår man
kan forkaste hypotesen, og hvornår man kan bekræfte den (Malchow-Møller et al. 2010:297). Ved
brug af en hypotesetest kan man altså finde ud af, om der er en signifikant forskel mellem stikprøvegennemsnittet og det sande gennemsnit i populationen.
Første trin i en hypotesetest er, som nævnt, at dele teorien op i to statistiske hypoteser; en nulhypotese, H0, og en alternativhypotese, H1 (Malchow-Møller et al. 2010:298). Det varierer fra situation
til situation, hvilken en af hypoteserne, der skal støtte op om teorien. Dette vil de følgende test, vi
udfører, vidne om. Det er kutyme at gøre den hypotese, der understøtter teorien, til alternativhypotesen, og dermed sætte den hypotese, der forkaster teorien som nulhypotesen (Malchow-Møller et
al. 2010:299). Man accepterer kun alternativhypotesen i det tilfælde, at der er stærke indicier imod
nulhypotesen. Dermed gør man det svært at bekræfte teorien, og i det tilfælde man kan bekræfte
den, vil det derfor være mere overbevisende (ibid.).
Når vi foretager en hypotesetest, er det vigtigt, at vi tager forbehold for fejl, da vi jo grundlæggende
ikke kan vide, hvad der er ”det sande” i populationen. Der er risiko for at begå to typer fejl (ibid.):
1. En type I-fejl, der forekommer, hvis man forkaster en nulhypotese, der er sand
2. En type II-fejl, der forekommer, hvis den nulhypotese man accepterer, er falsk
36
For at beregne sandsynligheden for at begå henholdsvis en type I og en type II-fejl, skal der opskrives en beslutningsregel (Malchow-Møller et al. 2010:300). Sandsynligheden for at begå en type Ifejl benævnes med α – defineret som en betinget sandsynlighed:
P (type I-fejl) = P (forkaste H0⏐ H0 sand) = α,
mens sandsynligheden for at begå en type II-fejl benævnes med β – også defineret som en betinget
sandsynlighed:
P (type II-fejl) = P (acceptere H0⏐ H0 falsk = β
11.2 Repræsentativitetstest for køn
Vi vil i det følgende foretage en såkaldt Z-test, for at undersøge om stikprøven er repræsentativ for
population i forhold til fordelingen mellem mænd og kvinder. Men først opstiller vi en nulhypotese,
H0, og en alternativhypotese, H1, så vi kan teste om andelen af mænd i stikprøven er lig andelen af
mænd i populationen:
H0: pstikprøven = ppopulationen
H1: pstikprøven ≠ ppopulationen
hvor p angiver andelen af mænd. Altså kommer hypoteserne til at se således ud:
H0: Andelen af mænd i stikprøven er lig med andelen af mænd i populationen
H1: Andelen mænd i stikprøven er forskellig fra andelen af mænd i populationen
Som det ses, er alternativhypotesen formuleret med ”forskellig fra”, hvilket vil sige, at det er en
såkaldt dobbeltsidet hypotese, da værdier på begge sider af nulhypotesen ligger inden for alternativhypotesen (Malchow-Møller et al. 2010:315). Det næste der skal ske er, at vi laver en beslutningsregel. Denne beslutningsregel kommer til at afgøre, hvornår vi vil vælge at tro på vores nulhypotese.
For teststatistikken, Z, kan man opskrive en beslutningsregel på baggrund af en kritisk værdi, cv,
som angiver de værdier indenfor hvilke, man er villig til at acceptere nulhypotesen. Man accepterer
H0, hvis Z ! cv og H1, hvis Z > cv (Malchow-Møller et al. 2010:304). Typisk fastsætter man den
kritiske værdi i forhold til risikoen for at begår en type-I-fejl, da en lille risiko for denne fejl tyder
på, at ens alternativhypotese holder (Malchow-Møller et al. 2010:305). I dette tilfælde betegner α
37
signifikansniveauet, som vi vælger at sætte til 5%. Det skal dog siges, at et lavt α medfører en øget
sandsynlighed for at begå en type-II-fejl, da der er et trade-off mellem α og β (Malchow-Møller et
al. 2010:306).
Under H0, det vil sige, når H0 gælder, da vil cv være lig Z1-α, da Z er standardnormalfordelt. Det vil
sige, at vi accepterer H0, hvis Z ! Z1-α og H1, hvis Z > Z1-α (ibid.). I tabellen ”Standardnormalfordeling: Fraktiler” (Malchow-Møller et al. 2010:436) finder vi, at z=+/-1,96, med et signifikansniveau
på 5%. Vi slår op under 0,975, da hypotesen er dobbeltsidet. Det vil sige, at den nedre grænse Za/2 =
Z0,025 og den øvre grænse er Z1-a = Z0,975. Som det ses i figur 1,1.1 er arealet på ”halerne” af tæthedsfunktionen α/2.
Figur 11.1. Dobbeltsidet standardnormalfordeling med øvre og nedre grænse
38
Nedenfor ses en tabel over henholdsvis stikprøven og populationens kønsfordeling.
Stikprøve
Population
Frekvens
Procent
Frekvens
Procent
Mand
2.486
49,91%
1.843.420
48,90%
Kvinde
2.495
50,09%
1.926.076
51,10%
Total
4.981
100
3.769.496
100
Tabel 11.2 Kønsfordelingen i hhv. stikprøve og populationen.
Som det ses i tabel 11.2 består stikprøven af 4.981 personer, hvoraf 49,91% er mænd og 50,09% er
kvinder. Populationen består af 3.769.496 personer, hvoraf 48,90% er mænd og 51,10% er kvinder.
Bemærk, at populationen såvel som stikprøven kun består af personer over 20 år. Resultaterne fra
tabellen har vi opstillet i figur 11.3 nedenfor, hvor man ser procentandelen for kvinder og mænd i
henholdsvis stikprøven og populationen. Man kan umiddelbart se, at forskellen mellem mænd og
kvinders andel er større i populationen end i stikprøven.
Kønsfordeling 60 50 40 Mand 30 Kvinde 20 10 49.91% 50.09% 48.9% 51.1% 0 Stikprøve Population Figur 11.3 Andelen af mænd og kvinder i hhv. stikprøven og population.
39
I det følgende vil det sige sig, om forskellen er signifikant. Med data fra tabel 11.2 kan vi nu udføre
en Z-test for repræsentativitet på køn. p angiver andelen af mænd. Man kan betragte pstikprøve og
ppopulation som to stikprøver. Da der er tale om en bernoullifordelt variabel, kan man udregne Z ved
brug af denne formel:
Z=
hvor
p ! p0
( p0 " (1! p0 ))
n
angiver andelen af mænd i stikprøven,
angiver andelen af mænd i populationen, og n
betegner de to stikprøvers størrelse (Malchow-Møller et al. 2010:318). Vi indsætter vores tal i formlen:
Z=
0, 4991! 0, 4890
= 1, 43
(0, 4890 " (1! 0, 4890))
4.981
Da vores Z-værdi på 1,43 ligger mellem vores kritiske værdier på +/-1,96, kan vi ikke forkaste vores H0-hypotese. Dette er illustreret i figur 11.4 nedenfor:
Figur 11.4: Dobbeltsidet standardnormalfordeling med anvist z-værdi på 1,43.
40
Hermed kan vi konstatere, at stikprøven er repræsentativ for kønsfordelingen i populationen. Desuden kan vi udregne en såkaldt p-værdi, der er en mere informativ indikator. Der gælder ved en dobbeltsidet alternativhypotese, at:
p ! værdi = 2 " ! (! z ) , hvor
angiver den kumulative sandsynlighed.
Z-værdien – nu med negativt fortegn – slås op i tabellen ”Standardnormalfordelingen: kumulative
sandsynligheder” i (Malchow-Møller et al. 2010:434). For z =-1,43 er den kumulative sandsynlighed 0,0764. Da er p-værdien = 2 ! 0, 0764 = 0,1528 .
Dette fortæller os, at der er 15,28% sandsynlighed for at trække en stikprøve, hvor andelen af mænd
er 0,4990 eller længere væk fra 0,4890, hvis den sande værdi i populationen er 0,4890. Med de
15,28% overskrider vi altså vores fastsatte signifikansniveau på 5%. Det vil sige, at der er en for
stor sandsynlighed for at begå en type-1-fejl, altså at forkaste en sand H0-hypotese. Da det netop er
H0-hypotesen, der underbygger repræsentativitet, kan vi på baggrund af p-værdien anskue, at vi
faktisk med en større sandsynlighed end de påkrævede 5%, kan konkludere, at stikprøven er repræsentativ.
41
11.3 Repræsentativitet for alder
Nu hvor vi har testet, om kønsfordelingen i vores stikprøve er repræsentativ for populationen, vil vi
teste om det samme gør sig gældende for aldersfordelingen. Vi har valgt at omkode aldersvariablen
i otte intervaller à 10 år, for at undgå at få for få respondenter i hver celle, da det skaber for stor
usikkerhed, at skulle udtale sig om dem, hvis det er tilfældet. Desuden bliver aldersfordelingen mere overskuelig, når den opdeles i intervaller (se omkodningen i do-file, bilag xx). Nedenfor ses et
søjlediagram og en tabel over den procentvise aldersfordeling i henholdsvis stikprøven og populationen:
Aldersfordeling 90 år og derover 0,78 0,56 4,59 4,00 80-­‐89 år 9,31 9,03 70-­‐79 år 12,16 60-­‐69 år 12,05 50-­‐59 år 18,51 19,27 40-­‐49 år 18,10 19,98 19,35 19,45 30-­‐39 år 17,19 15,66 20-­‐29 år 0 10 Fordeling i population 20 30 Fordeling i levekårsundersøgelsen Figur 11.5 Aldersfordelingen i hhv. population og stikprøven i procent
42
Aldersfordeling
Alder i år
20-29
30-39
40-49
50-59
60-69
70-79
80-89
90+
I alt
Analyse-
780
969
995
960
600
450
199
28
4.981
udvalg
15,66%
19,45%
19,98%
19,27%
12,05%
9,03%
4,00%
0,56%
100%
Populati-
647.873
729.300 682.379 697.914 458.221 351.046 173.184 29.579
3.769.
on
17,19%
19,35%
496
18,10%
18,51%
12,16%
9,31%
4,59%
0,78%
100%
Tabel 11.6 Aldersfordelingen i hhv. population og stikprøven opgivet i frekvens og procent
Som det fremgår af figur 11.5 og tabel 11.6 er der en underrepræsentation på 1,53 procentpoint af
de 20-29 årige og en overrepræsentation af de 40-49 årige på 1,88 procentpoint. Spørgsmålet er så,
om der blot er tale om tilfældige afvigelser eller om bortfaldet er skævt. Til at undersøge om denne
stikprøvefordeling er signifikant afvigende fra fordelingen i populationen, vil vi benytte os af en
såkaldt χ2-test for fordelinger. Årsagen til at vi har valgt en χ2-test frem for en Z-test er, at vi med
en χ2-test kan teste om fordelingen er den samme, mens en Z-test bruges til at teste forskelle i middelværdier. I denne sammenhæng kan en Z-test altså bruges til at teste, om der er en signifikant
over- eller underrepræsentation af respondenter for hvert aldersinterval i stikprøven sammenlignet
med populationen. Ved hjælp af en χ2-test kan vi derimod sammenligne om den samlede observerede aldersfordeling i vores stikprøve svarer til den faktiske aldersfordeling i populationen
(Malchow-Møller et al. 2010:363).
En χ2-test har to funktioner. For det første kan man teste om en given diskret stokastisk variabels
fordeling, følger en hypotetisk fordeling, der for eksempel stammer fra en teori (Malchow-Møller
et. al. 2010:361). For det andet kan man med en χ2-test teste for uafhængighed mellem to variabler
(Malchow-Møller et al. 2010:370f). Denne funktion vender vi tilbage til, når vi afprøver vores empiriske hypotese (jf. afsnit 12.1 om χ2-test for uafhængighed). I det følgende vil vi gøre brug af den
første funktion. For at udføre en sådan χ2-test sætter vi et signifikansniveau α til 5 %, og opstiller en
nul- og alternativhypotese:
43
H0: p1 = π1 , p2 = π2 , … , pK = πK
H1: mindst én pk ≠ πk ,
k = 1, … , K
Hvor K, kaldet kategorier, angiver de mulige værdier, som den stokastiske variabel kan antage, p er
sandsynligheden for hver af disse kategorier og π1, …, πK er kategoriernes hypotetiske sandsynligheder (Malchow-Møller et. al. 2010:361f). Nulhypotesen er altså her, at aldersfordelingen i stikprøven er lig populationens aldersfordeling, mens alternativhypotesen angiver, at stikprøvefordelingen
er forskellig fra fordelingen i populationen. χ2-testen er derfor her en test for homogenitet
(Malchow-Møller et al. 2010:374). Idéen bag en χ2-test er, at den sammenligner den observerede
frekvens, Zk, med den faktiske frekvens svarende til H0, n ⋅ πk. Selve teststatistikken for en χ2fordeling ser derfor ud som følger (Malchow-Møller et. al. 2010:362):
K
(Z k / n " ! k )2 K (Z k " n ! ! k )2
=#
#n ! !
n !!k
k
k=1
k=1
Hvor antallet af observationer i stikprøven med værdien xk betegnes Zk, og det forventede antal
observationer under H0 med værdien xk i en stikprøve med n observationer betegnes n ⋅ πk
(Malchow-Møller et al. 2010:362). Vi vil nu vise udregningen af χ2-cellebidraget for aldersintervallet 20-29 år. De anvendte data fremgår af henholdsvis ovenstående og nedenstående tabel, 11.6 og
11.7:
χ2 =
K
(780 ! 886)2
" 886
k=1
χ2 = 12, 59
44
χ2-cellebidragene for resten af aldersintervallerne er angivet i tabellen nedenfor:
Andel under
Frekvens under
χ2
H0, populationens π
H0 (n ⋅π)
cellebidrag
20-29 år
0,18
886
12,59
30-39 år
0,20
1001
1,02
40-49 år
0,18
907
8,59
50-59 år
0,18
901
3,85
60-69 år
0,12
586
0,32
70-79 år
0,09
445
0,07
80-89 år
0,04
218
1,71
90-99 år
0,01
37
2,12
100-109 år
0,00
1
0,59
110 år +
0,00
0
0,00
Total
1
4981
31
Alder
Tabel 11.7: χ2-cellebidrag for aldersintervaller
Da signifikans ikke alene afhænger af χ2-værdien, udregner vi også de såkaldte frihedsgrader. Frihedsgrader betegner antallet af sandsynligheder, der kan vælges ”frit” fratrukket estimerede parametre (Malchow-Møller et al. 2010:372). Antallet af frihedsgrader beregnes ved følgende formel:
d.f. = (c-1) ⋅ (r-1)
Hvor c angiver antal udfald i X-variablen og r er antallet af Y-variablens udfald. I dette tilfælde,
hvor vi kun arbejder med en variabels udfald, udregnes frihedsgraderne ved at trække 1 fra antallet
af udfald i variablen. Antallet af frihedsgrader er hermed:
d.f. = 10-1 = 9
Den samlede χ2-værdi er summen af de enkelte χ2-cellebidrag. Som det fremgår af tabel 11.7 har vi
udregnet denne χ2-værdi til 31, hvilket med 9 frihedsgrader overskrider den kritiske værdi på 16,9
(Malchow-Møller et al. 2010:438). Aldersfordelingen i stikprøven er hermed signifikant afvigende
45
fra populationens aldersfordeling. Det betyder, at vi må forkaste vores H0-hypotese og tro på H1hypotesen. Da vi kun arbejder med en enkelt variabel, er det ikke muligt at foretage en såkaldt enkeltcelletest, for at finde ud af, hvilke alderskategorier, der forårsager skævvridningen med en signifikant under- eller overrepræsentation. Vi vil dog udføre en sådan enkeltcelletest, når vi afprøver
vores empiriske hypotese (se afsnit 12.2 om enkeltcelletest). Til at undersøge under- og overrepræsentationen for hver alderskategori, kan man i stedet benytte en Z-test, som tidligere beskrevet. Vi
har dog skønnet, at det er vigtigere for vores analyse at vide noget om den generelle aldersrepræsentativitet, frem for at kende til de specifikke alderskategoriers fordeling. I vores videre analyse skal
denne repræsentativitetstest af alder tages in mente, fordi analyseresultaterne fra stikprøven ikke
umiddelbart kan generaliseres til populationen. I vores undersøgelse har netop aldersfordelingen en
betydning, da helbred alt andet lige er påvirket af den enkeltes alder. Dog betyder denne skævvridning af aldersfordelingen i stikprøven ikke, at vi ikke kan udtale os om vores variable ud fra vores
kommende statistiske analyse, vi skal blot tage forbehold for den manglende repræsentativitet.
11.3.1 P-værdi
I ovenstående udregnede vi antallet af frihedsgrader til at være 9. Når vi kender antal frihedsgrader,
kan vi udregne en p-værdi. P-værdi er et matematisk udtryk for sandsynligheden (p = probability)
for at observere den fundne forskel eller en der er større, forudsat at nulhypotesen er sand. Hvor stor
eller lille p-værdi, vi kan acceptere afhænger af signifikansniveauet. Da vi som bekendt, har sat
vores signifikansniveau til 5%, skal vores p-værdi være under disse 5%, hvis vi skal kunne afvise
vores H0-hypotese jf. risikoen for type-I-fejl (jf. afsnit 11.2). For at udregne p-værdien indsætter vi i
Excel funktionen: ”CHIFORDELING” (χ2-værdi;frihedsgrader).
P-værdi = (31;9) = 0,000311536
Vi har således udregnet vores p-værdi til 0,000311536, hvilket betyder, at vi kan forkaste H0hypotesen, da den ligger under 0,5. Aldersfordelingen i Levekårsundersøgelsen er altså ikke repræsentativ for populationen, som vi også kunne konstatere ud fra vores χ2-værdi på 31, der overskrider
den kritiske værdi på 16,9.
46
11.4 Repræsentativitetstest for indkomst
Vi vil nu lave en χ2-test for fordeling af indkomst. Denne test er brugbar, fordi vi ønsker at sammenligne intervaller. I Levekårsundersøgelsen bliver respondenterne nemlig bedt om at placere
deres bruttoindkomst i intervaller ud fra spørgsmålet: ”Hvor stor var Deres/familiens samlede indkomst i 1999 brutto, dvs. før skat og fradrag er trukket fra?” (Levekårsundersøgelsen 2000). Derfor
har vi hentet information fra Danmarks Statistik, hvor indkomsten brutto også er opdelt i intervaller.
Dog har det ikke været muligt for os at finde information fra samme år. I Levekårsundersøgelsen fra
år 2000 bliver respondenterne spurgt til deres bruttoindkomst året før, mens data fra Danmarks Statistik er fra år 2001. Dette giver alt andet lige anledning til fejlkilder. Derudover har vi omkodet
intervallerne fra Levekårsundersøgelsen, så de matcher dem fra Danmarks Statistik (jf. dofile i bilag, afsnit 18.1).
I de to tabeller nedenfor ses indkomstintervallerne for henholdsvis stikprøven og populationen i
tabel 11.8 og 11.9. Vores stikprøve består af 4.650 personer. Bortfaldet består af 275 respondenter,
der har svaret ’ved-ikke’, 48 der ’ikke vil svare’, mens information om 8 af respondenterne er ’uoplyst’. Det kan tænkes, at nogle respondenter har syntes, at det er ubehageligt at oplyse deres indkomst eller at de ikke har haft noget overblik over deres indkomst året før. Selvoplyst indkomst er i
det hele taget forbundet med en del usikkerhed, i modsætning til baggrundsvariablerne køn og alder, som vi også har lavet repræsentationstest for. Det skyldes, at information om køn og alder ikke
stammer fra respondenterne selv, men er hentet fra CPR-registret.
Stikprøve, indkomst
Frekvens
Procent
Under 200.000 kr.
1.213
26,09
200.000 - 299.999 kr.
747
16,06
300.000 - 399.999 kr.
710
15,27
400.000 - 499.999 kr.
730
15,70
500.000 - 599.999 kr.
579
12,45
600.000 kr. og derover
671
14,43
I alt (antal)
4.650
100,00
Tabel 11.8: Bruttoindkomst, strikprøve
47
Population, indkomst
Frekvens
Procent
Under 200.000 kr.
90.1444
33,64
200.000 - 299.999 kr.
51.5784
19,25
300.000 - 399.999 kr.
32.0193
11,95
400.000 - 499.999 kr.
29.0598
10,85
500.000 - 599.999 kr.
25.2505
9,42
600.000 kr. og derover
39.8896
14,89
I alt (antal)
2.679.420
100,00
Tabel 11.9: Bruttoindkomst, population
I stikprøven såvel som populationen er der procentvist flest placeret i det laveste indkomstinterval
på under 200.000kr, henholdsvis 26,09% og 33,64%. Som indkomstintervallerne øges, falder andelen i både stikprøve og population, men i den højeste kategori (600.000 kr. og derover) er der igen
procentvist flere placeret. Dette kan måske skyldes, at mange husholdninger med to eller flere indtægter falder ind her. På figur 11.10 nedenfor kan man tydeligere se forskellene mellem hvert indkomstinterval i henholdsvis stikprøven og populationen.
48
Indkomstintervaller 14,89 14,43 600.000 kr. og derover 500.000 -­‐ 599.999 kr. 9,42 12,45 400.000 -­‐ 499.999 kr. 10,85 15,7 Population 11,95 15,27 300.000 -­‐ 399.999 kr. Stikprøve 19,25 16,06 200.000 -­‐ 299.999 kr. Under 200.000 kr. 26,09 0 5 10 15 20 25 30 33,64 35 40 Figur 11.10: Indkomstintervaller opdelt i population og stikprøve
Nu er vi klar til at foretage selve χ2-testen. Vi sætter vores nulhypotese og alternativhypotese til:
H0: p1 = π1 , p2 = π2 , … , pK = πK
H1: mindst én pk ≠ πk ,
k = 1, … , K
Hvor K, kaldet kategorier, angiver de mulige værdier, som den stokastiske variabel kan antage, p er
sandsynligheden for hver af disse kategorier og π1, …, πK er kategoriernes hypotetiske sandsynligheder (Malcho-Møller et al. 2010:361f). Vores nulhypotesen er, at indkomstfordelingen i stikprøven
er lig populationens indkomstfordeling, og alternativhypotese er, at stikprøvefordelingen er forskellig fra fordelingen i populationen.
49
Vi sætter signifikansniveauet, , til 5%. Vi opsummerer vores udregninger for χ2-testen i det nedenstående:
Andel under
Frekvens under
χ2
H0, populatio-
H0 (n ⋅π)
Cellebidrag
Indkomstintervaller
nens π
Under 200.000 kr.
0,33
1564
78,87
200.000 - 299.999 kr.
0,19
895
24,51
300.000 - 399.999 kr.
0,11
556
42,85
400.000 - 499.999 kr.
0,10
505
100,7
500.000 - 599.999 kr.
0,09
438
45,36
600.000 kr. og derover
0,14
692
0,66
Total
1
4650
293
Frihedsgrader
5
P-værdi
3,13488E-61
Tabel 11.11: χ2-test for indkomst
Vi finder, at antallet af frihedsgrader er 5, idet der er 6 udfald for χ2-værdien, som vi trækker 1 fra.
Vi aflæser i tabellen ”χ2-fordelingen: Fraktiler” i Malchow-Møller et al. (2010:438), at med 5 frihedsgrader og et signifikansniveau på 5% er den kritiske værdi 11,1. Vores fundne χ2-værdi på 293
er dermed signifikant afvigende fra den teoretiske kritiske grænse, da den overskrider den kritiske
værdi.
50
Nedenfor ses figur 11.12, der viser H0- og H1-rummet for vores χ2-test for fordeling af indkomst.
Den kritiske værdi på 11,1 samt vores χ2-værdi på 293 er markeret.
Figur 11.12: χ2-fordeling for indkomst med opstillede hypoteser
Som det fremgår af figur 11.12, må vi forkaste vores H0-hypotese og tro på H1-hypotesen, hvilket
betyder, at stikprøven ikke er repræsentativ for populationen. Derudover er p-værdien=3,13488E-61
(se tabel 11.11), hvilket er langt under vores signifikansniveau på 5%. Dette underbygger forkastningen af H0-hypotese. At stikprøven ikke er repræsentativ kan til dels skyldes, at der er en forskel
mellem data fra stikprøven og populationen grundet de to års forskel. Derudover er det forbundet
med en vis usikkerhed, at respondenterne er blevet bedt om selv at estimere deres indkomst. Da
indkomst er en parameter, der medvirker til social differentiering i samfundet, er det væsentligt for
vores analyseresultater, at der er denne forskel. I den følgende statistiske analyse af vores empiriske
hypotese, må vi derfor tage forbehold for den manglende repræsentativitet på indkomst.
51
12. Test af empirisk hypotese
12.1 χ2-test for uafhængighed
Nu hvor vi har testet for repræsentativitet på baggrundsvariablene køn, alder og indkomst, er vi klar
til at teste vores empiriske hypotese. I det følgende vil vi udføre en såkaldt χ2-test for uafhængighed. Denne test bygger på den samme teststatisk, som vi benyttede, da vi testede for repræsentativitet af alder og indkomst. Forskellen er, at vi ikke tester, om der er homogenitet mellem to fordelinger, men om to diskrete stokastiske variable er uafhængige af hinanden (Malchow-Møller et al.
2010:370). Uafhængighed referer her til, at information om den ene variabel ikke ændrer fordelingen af den anden (Malchow-Møller et al. 2010:90). Herved afprøver vi vores empiriske hypotese,
idet vi tester, om der er en statistisk sammenhæng mellem ’nære venskaber’ og ’selvvurderet helbred’. Første skridt i konstruktionen af en χ2-test for uafhængighed er at opstille to hypoteser – en
nul- og en alternativhypotese:
H0: Uafhængighed dvs. f(x,y) = fx(x) ⋅ fy(y) for alle værdier af x og y
H1: Ikke-uafhængighed dvs. f(x,y) ≠ fx(x) ⋅ fy(y) for mindst én værdi af x og y
Under H0 er den marginale sandsynlighedsfunktion for X, fx(x), ganget med den marginale sandsynlighedsfunktion for Y, fy(y) lig den simultane sandsynlighedsfunktion, f(x,y) (Malchow-Møller
et.al. 2010:370). Vores nulhypotese er således, at der er uafhængighed mellem vores variabler ’nære
venskaber’ og ’selvvurderet helbred’, mens alternativhypotesen angiver, at der ikke er uafhængighed mellem disse variabler. Årsagen til, at vi skriver ikke-uafhængighed, er, at vi statistisk ikke kan
konkludere noget om afhængighed – blot ikke-uafhængighed. Vi fastsætter desuden vores signifikansniveau til 5 %, hvilket gør det forholdsvis svært for os at ”lande” i H1-rummet.
52
Før vi går i gang med selve testen, vil vi skabe et overblik over variablernes fordeling. Her kommer
først et søjlediagram, der viser procentfordelingen af ’nære venskaber’ og ’selvvurderet helbred’:
Sammenhæng mellem nære venskaber og selvvurderet helbred 90 80 Har De nogen venner, som De kan tale med om personlige problemer? 70 60 39% Ja Nej 26% 50 40 30 24% 20 42% 40% 10 13% 9% 2% 3% 0 Virkelig godt Godt Nogenlunde Dårligt 1% Meget dårligt Hvordan vil De alt i alt vurdere Deres helbred? Figur 12.1: Søjlediagram over sammenhængen mellem ’nære venskaber’ og ’helbred’
Som det fremgår af diagrammet summer de to udfaldsrum ’ja’ og ’nej’ i variablen ’nære venskaber’
hver især til 100%. Søjlerne angiver således procentfordelingen af henholdsvis ’nære venskaber’ og
’ingen nære venskaber’ for de fem udfaldsrum af variablen ’selvvurderet helbred’. Langt de fleste
respondenter fordeler sig i kategorierne ’godt’ og ’virkelig godt’, hvorimod kun ganske få respondenter har svaret ’meget dårligt’. Det er vigtigt at være opmærksom på dette relativt lave antal af
respondenter, eftersom den statistiske usikkerhed øges jo færre respondenter, der er i en celle.
53
Nedenfor ses en tovejstabel, der ligeledes viser sammenhængen mellem ’nære venskaber’ og ’selvvurderet helbred’. Her angives antallet af respondenter i hver celle samt de marginale sandsynligheder:
Har De nogen
Hvordan vil De alt i alt vurdere Deres helbred?
venner, som De
kan tale med om
Virkelig
personlige pro-
godt
Godt
Nogenlunde
Dårligt
Meget
Total
dårligt
Marginal
sandsynlighed
blemer?
Ja
1.823
1.728
554
144
47
4.296
0,86
Nej
175
264
162
60
16
677
0,14
Total
1.998
1.992
716
204
63
4.973
1
Marginal sandsyn-
0,40
0,40
0,14
0,04
0,01
1
lighed
Tabel 12.2: Sammenhængen mellem ’nære venskaber’ og ’selvvurderet helbred’
Vi har udregnet de marginale sandsynligheder, som er sandsynlighederne for hver af de stokastiske
variabler (Malchow-Møller et.al. 2010: 85f), ved at dividere totalen for hver kolonne med den samlede total jf. afsnit 9.3.2 i teoridelen. Disse skal bruges senere hen, når vi skal udføre en enkeltcelletest. Her er udregningen af den marginale sandsynlighed for kolonnen ’virkelig godt’:
Marginal sandsynlighed =
1998
= 0, 40
4973
For at kunne udføre en χ2-test for uafhængighed, udregner vi den forventede fordelingen under H0
ud fra følgende formel:
f (x, y) =
f x (x)! f y (y)
n
Ved at gange kolonnens total med rækkens total og dernæst dividere med antallet af observationer
fås den forventede fordeling under H0.
54
Nedenfor ses en tabel, der viser, hvordan respondenterne i stikprøven ville fordele sig, hvis der var
uafhængighed mellem de to variabler:
Har De nogen
venner, som De
Hvordan vil De alt i alt vurdere Deres helbred?
Virkelig godt
Godt
Nogenlunde
Dårligt Meget
kan tale med
dårligt
om personlige
problemer?
Ja
1726
1721
619
176
54
Nej
272
271
97
28
9
Tabel 12.3 Forventet fordeling under H0
Vi bruger tallene fra tabel 12.2. Nedenfor ses en udregning for hvor mange respondenter, der ville
svare ’virkelig godt’ og ’ja’ under H0:
f (x, y) =
1998! 4296
= 1726
4973
Efter at have udregnet de forventede værdier under H0, er vi nu klar til at udføre selve χ2-testen for
uafhængighed. Det enkelte cellebidrag udregnes med den samme formel, som vi anvendte i χ2testen for fordelinger i repræsentativitetstesten for alder og indkomst:
K
(Z k ! n " ! k )2
x =#
n "!k
k=1
2
Ved at udnytte forskellen mellem den observerede fordeling i stikprøven, Zk, og den forventede
fordeling under H0, n ⋅ πk, udregnes hver enkelt celles χ2-værdi.
55
Her ses en tabel, der viser disse χ2-cellebidrag, den samlede χ2-værdi samt antallet af frihedsgrader:
Har De nogen venner,
som De kan tale med om Hvordan vil De alt i alt vurdere Deres helbred?
personlige problemer?
Virkelig
Godt
Nogenlunde
Dårligt
Meget dårligt
godt
Ja
5,45
0,03
6,73
5,89
1,01
Nej
34,59
0,19
42,72
37,40
6,43
χ 2-værdi
140,44
Frihedsgrader
4
Tabel 12.4: χ2-test for uafhængighed mellem ’nære venskaber’ og ’selvvurderet helbred’
Vi indsætter tallene fra ’virkelig godt’ og ’ja’ fra tabel 12.2 og 12.3 i formlen, så det kommer til at
se ud som følger:
K
(1823!1726)2
= 5, 45
1726
k=1
x2 = "
Ligesom i repræsentativitetstesten for alder og indkomst, afhænger signifikans ikke kun af χ2værdien, men også af antal frihedsgrader. Vi benytter den samme formel som tidligere – nemlig:
d.f. = (c-1) ⋅ (r-1)
Og får antallet af frihedsgrader til:
d.f. = (2-1) ⋅ (5-1) = 4
Vi får vores samlede χ2-værdi til at være 140,44 ved at summere alle χ2-cellebidragene fra tabel
12.4. Med 4 frihedsgrader og et 5% signifikansniveau overskrider vi derfor vores kritiske værdi på
9,49 (Malchow-Møller et al. 2010:438). Vi må derfor forkaste vores H0-hypotese og bekræfte vores
H1-hypotese. Hermed kan vi konstatere, at der er en ikke-uafhængighed mellem ’nære venskaber’
og ’selvvurderet helbred’. Vi kan således ikke umiddelbart forkaste vores empiriske hypotese.
56
12.2 Enkeltcelletest
Da χ2-testen for uafhængighed ikke kan sige os noget om hvilke kategorier, der er signifikant under- eller overrepræsenteret, vil nu udføre en enkeltcelletest – også kaldet en rxy-test. . En enkeltcelletest kan vise os, hvilke sammenhænge mellem ’nære venskaber’ og ’selvvurderet helbred’, som
ikke passer på H0-hypotesen. Vi udregner rxy-værdier for hver kategori. Disse kan enten være numerisk store eller små afhængig af, om den observerede frekvens afviger fra den forventede frekvens
under H0. Enkeltcelletesten bygger således videre på de samme idéer som vores χ2-testen for uafhængighed. En rxy-teststatistik følger principperne for en normalfordeling, idet rxy under H0 er approksimativt standardnormalfordelt. Derfor anvender vi stadig et signifikansniveau på 5%, som
betyder, at hvis rxy-værdien for en celle er numerisk større end +1,96, er denne i uoverensstemmelse
med vores H0-hypotese. rxy-værdien er givet ved følgende formel (Malchow-Møller et al.
2010:372f):
rxy =
(Z xy ! n " ! xy )
n " ! xy (1! f x (x))" (1! f y (y))
Hvor den forventede værdi er udtrykt i n ⋅ πxy = n ⋅ fx(x) ⋅ fy(y), og Zxy er det observerede antal i den
celle, hvor X=x og Y=y (Malchow-Møller et al. 2010:373). Når vi indsætter tallene fra tabel 12.2
og 12.3, får vi hermed:
rxy =
(1823!1726)
= 8,18
1726 " (1! 0, 40)" (1! 0,86)
Da der kun er to udfaldsrum for den Bernoullifordelte variabel ’selvvurderet helbred’, er rxyværdierne logisk nok det samme tal i hver kolonne bare med omvendt fortegn.
57
I følgende tabel ses alle de udregnede rxy-værdier:
Har De nogen venner, som Hvordan vil De alt i alt vurdere Deres helbred?
De kan tale med om personlige problemer?
Virkelig
Godt
Nogenlunde
Dårligt
Meget dårligt
godt
Ja
8,18
0,61
-7,60
-6,72
-2,74
Nej
-8,18
-0,61
7,60
6,72
2,74
Tabel 12.5: Enkeltcelleværdier
Som det fremgår af tabel 12.5, overskrider alle rxy-værdierne med et 5%-signifikansniveau de kritiske værdier på +1,96 på nær værdierne for ’godt’. For disse celler må vi derfor forkaste H0 og tro på
H1-hypotesen. Det betyder, at vi for disse kategorier kan tale om en ikke-uafhængighed. Ud fra rxyværdiernes fortegn kan vi vurdere, om kategorierne er signifikant under eller over de forventede
værdier for uafhængighed. Hvis fortegnet er negativt betyder det således, at vores faktiske fordeling
er lavere end under H0. Hvis fortegnet derimod er positivt, angiver dette, at den faktiske fordeling er
højere end under H0. Forklaringen herpå er, at vi med rxy-teststatistikken trækker den hypotetiske
fordeling fra den faktiske fordeling.
Vi har markeret de værdier, der er numerisk for store i forhold til den forventede værdi under H0
med grønt. Vi kan se, at der er en klar overrepræsentation af dem, der har ’nære venskaber’, som
har vurderet deres helbred til ’virkelig godt’ i forhold til dem, der ikke har ’nære venskaber’. Samtidig kan vi ud fra rxy-værdierne i tabel 12.5 se, at de, der har ’nære venskaber’ og vurderer deres
helbred dårligere – det vil sige ’nogenlunde’, ’dårligt’ og ’meget dårligt’ – er signifikant underrepræsenteret. De værdier, der er numerisk for små, har vi markeret med rødt. Her kan vi, når vi kigger på dem med ’ingen nære venskaber’, se en underrepræsentation i kategorien ’virkelig godt’ og
omvendt se en signifikant overrepræsentation under ’nogenlunde’, ’dårligt’ og ’meget dårligt’. Som
nævnt, er fordelingen for ’godt’ den eneste kategori, hvor vores rxy-værdier ikke overskrider de kritiske værdier på +1,96. Vi kan derfor ikke tale udtale os om en specifik over-eller underrepræsentation i denne kategori, fordi vi ikke har at gøre med signifikante værdier. I en anden stikprøve kunne
vi nemlig lige så godt få det omvendte resultat grundet stikprøvetilfældigheder.
58
På baggrund af vores χ2-test samt vores enkeltcelletest kan vi hermed konkludere, at der er en signifikant ikke-uafhængighed mellem ’nære venskaber’ og ’selvvurderet helbred’. Der er således en
tendens til, at respondenter med ’nære venskaber’, vurderer deres helbred bedre end dem, der har
svaret, at de ’ingen nære venskaber’ har. Det vil altså sige, at vi kan forkaste vores H0-hypotese om
uafhængighed og acceptere vores H1-hypotese om ikke-uafhængighed. Vi kan på baggrund af vores
tests derfor ikke afkræfte vores empiriske hypotese om en sammenhæng mellem ’nære venskaber’
og ’selvvurderet helbred’. Dog kan vi ikke udtale os statistisk om et eventuelt kausalitetsforhold.
13. Test af supplerende empirisk hypotese
13.1 χ 2 -test for uafhængighed
Som det fremgår af ovenstående statistiske analyse, kan vi ikke afkræfte vores empiriske hypotese
om, at der er en sammenhæng mellem ’nære venskaber’ og ’selvvurderet helbred’. Ud fra vores
teoretiske udgangspunkt kan vi derfor tale for, at social kapital påvirker den enkeltes helbred. I denne forbindelse er det relevant at undersøge, om der eventuelt kan være andre faktorer, der ligeledes
påvirker helbredet. Her er det yderst relevant at teste, om der er en sammenhæng mellem ’indkomst’ og ’selvvurderet helbred’, eftersom indkomst er en af de helt klassiske differentieringskræfter i samfundet. Desuden lægger valget af baggrundsvariablen ’indkomst’ også i naturlig forlængelse af vores teoretiske redegørelse for Bourdieus teori, som foruden social kapitalbegrebet også opererer med et økonomisk kapitalbegreb (jf. afsnit 3.1). Det er derfor interessant at undersøge, om
’selvvurderet helbred’ ligeledes påvirkes af ’indkomst’ Det er dog vigtigt endnu en gang at understrege, at vi ikke statistisk kan udtale os om kausalitet. I det følgende vil vi derfor ved hjælp af en
χ2-test for uafhængighed undersøge, om der er en statistisk ikke-uafhængighed mellem ’indkomst’
og ’selvvurderet helbred’. Vi benytter således den samme teststatistisk som i ovenstående analyse af
vores overordnede empiriske hypotese. Først opstiller vi en ny supplerende empirisk hypotese:
Indkomst Selvvurderet helbred 59
Vores hypotese er hermed, at der er en sammenhæng mellem den enkeltes årlige hustandsindkomst
og selvvurderede helbred. Her er denne hypotese uddybet i to underhypoteser:
Høj indkomst Lav indkomst Godt selvvurderet helbred Dårligt selvvurderet helbred Med disse empiriske hypoteser på plads er vi klar til at udføre selve χ2-testen for uafhængighed. Vi
sætter igen vores signifikansniveau til 5% og opstiller en nul- og alternativhypotese:
H0: Uafhængighed dvs. f(x,y) = fx(x) ⋅ fy(y) for alle værdier af x og y
H1: Ikke-uafhængighed dvs. f(x,y) ≠ fx(x) ⋅ fy(y) for mindst én værdi af x og y
Vores nulhypotese er hermed, at der er uafhængighed mellem vores variabler ’indkomst’ og ’selvvurderet helbred’, mens alternativhypotesen angiver, at der er en ikke-uafhængighed mellem disse
variabler.
60
Nedenfor ses en tovejstabel, der viser sammenhængen mellem ’indkomst’ og ’selvvurderet helbred’
samt de marginale sandsynligheder:
Hvordan
vil De alt i
alt vurdere Hvor stor var Deres/familiens samlede indkomst i 1999 (brutto)?
Deres helbred?
200.000-
300.000-
299.999
399.9999 499.999
599.999
kr.
kr.
kr.
kr.
351
285
299
324
283
358
433
303
304
326
241
254
Nogenlunde 298
112
77
59
45
49
Dårligt
100
35
26
13
7
5
30
10
4
8
2
5
1212
745
710
730
578
671
0,26
0,16
0,15
0,16
0,12
0,14
<200.0
00 kr.
Virkelig
godt
Godt
Meget dårligt
Total
Marginal
sandsynlig-
400.000-
500.000-
>600.000
Total
Marginal
sandsynlig-
kr.
hed
1900
1861
640
186
59
4646
0,41
0,40
0,14
0,04
0,01
1
1
hed
Tabel 13.1: Sammenhængen mellem ’indkomst’ og ’selvvurderet helbred’
Vi er opmærksomme på, at det samlede antal af respondenter er væsentlig lavere her (4.646) sammenlignet med antallet i den statistiske analyse af den overordnede empiriske hypotese (4.973).
Årsagen er, at en del respondenter har svaret ’ved ikke’ eller ’vil ikke svare’ på indkomst’variablen. Vi har dog vurderet, at det er vigtigere at beholde et så stort respondentantal som muligt i
selve analysen, end at slette de 327 respondenter fra alle vores data, for at udføre denne ekstra ana-
61
lysetest. Desuden er det vigtigt at påpege, at to af kategorierne ikke opfylder ”reglen” om minimum
fem respondenter i hver celle. Det drejer sig om kategorierne ’meget dårligt’ samt henholdsvis
’300.000-399.999 kr.’ og ’500.000-599.999 kr.’. Her er den statistiske usikkerhed altså for stor til,
at vi med rimelighed kan udtale os om disse kategorier.
Selve fremgangsmåden i denne test følger, som nævnt, de samme principper, som χ2-testen for uafhængighed mellem ’nære venskaber’ og ’selvvurderet helbred’ (jf. afsnit 12.1). Først udregnes således de forventede værdier under H0 for hver kategori, og dernæst udregnes hver enkelt celles χ2værdi ved at sammenholde den observerede frekvens, Zk, med den forventede frekvens under H0, n ⋅
πk.
Her har vi dog ikke beregnet χ2-værdierne manuelt i Excel som før, men udregnet χ2-
cellebidragene ved hjælp af statistikprogrammet, Stata (jf. dofile afsnit 18.1). Nedenfor ses hermed
en tabel med Statas udregninger af χ2-cellebidragene, den samlede χ2-værdi og antallet af frihedsgrader:
Hvordan vil
De alt i alt
vurdere
Deres hel-
Hvor stor var Deres/familiens samlede indkomst i 1999? (brutto)
bred?
Under
200.000-
300.000-
400.000-
500.000-
600.000 kr. og
200.000 kr.
299.999 kr.
399.999 kr.
499.999 kr.
599.999 kr.
derover
Virkelig godt
42,2
1,3
0,3
2,2
9,2
25,5
Godt
5,7
0,1
1,4
3,9
0,4
0,8
Nogenlunde
102,9
0,9
4,4
17,2
15,1
20,4
Dårligt
54,6
0,9
0,2
9
11,3
17,8
ligt
13,9
0
2,8
0,2
3,9
1,5
χ2-værdi
369,48
Meget dår-
Frihedsgrader
20
Tabel 13.2: χ2-test for uafhængighed
62
Med et signifikansniveau på 5% og 20 frihedsgrader overskrider den samlede χ2-værdi på 369,48
den kritiske grænse på 31,4 (Malchow-Møller et al. 2010:438). Vi må derfor forkaste vores H0hypotese og tro på H1-hypotesen om ikke-uafhængighed. Vi kan altså ikke umiddelbart afkræfte
vores supplerende empiriske hypotese om, at der er en sammenhæng mellem ’indkomst’ og ’selvvurderet helbred’.
13.2 Enkeltcelletest
Ligesom i den statistiske analyse af vores overordnede empiriske hypotese, er det yderst relevant at
udføre en enkeltcelletest i forlængelse af χ2-testen for uafhængighed. Med denne kan vi nemlig finde ud af, hvilke kategorier, der er signifikant over- eller underrepræsenteret i den observerede fordeling sammenholdt med den forventede fordeling under H0. Vi fastholder vores signifikansniveau
på 5%, hvilket betyder, at vi kan udtale os om en henholdsvis over- eller underrepræsentation, hvis
rxy-værdien for en kategori er numerisk større end +1,96. Teststatistikken for rxy-værdien følger de
samme principper som enkeltcelletesten af ’nære venskaber’ og ’selvvurderet helbred’ (jf. afsnit
12.2). Her er enkeltcelletesten ligeledes regnet ved hjælp af Stata (jf. dofile afsnit 18.1). Nedenfor
ses således en tabel, der viser Statas udregninger af rxy-værdierne for sammenhængen mellem ’indkomst’ og ’selvvurderet helbred’:
Hvordan
vil De alt i
alt vurdere
Deres helbred?
Hvor stor var Deres/familiens samlede indkomst i 1999? (brutto)
Under
200.000 kr.
200.000-
300.000-
400.000-
500.000-
299.999 kr. 399.999 kr. 499.999 kr. 599.999 kr.
600.000 kr. og
derover
Virkelig
godt
-9,83
-1,6
0,72
2,09
4,22
7,1
Godt
-3,58
0,37
1,63
2,76
0,86
-1,26
Nogenlunde
12,7
1,09
-2,46
-4,86
-4,47
-5,26
Dårligt
8,77
1,06
-0,5
-3,37
-3,66
-4,66
4,36
0,19
-1,83
-0,46
-2,12
-1,31
Meget dårligt
Tabel 13.3: Enkeltcelletest
63
Som det fremgår af tabellen, overskrider mere end halvdelen af rxy-værdierne for vores kategorier
den kritiske værdi på +1,96. Vi har igen markeret de kategorier, der er numerisk for store i forhold
til den forventede værdi under H0 med grønt. Mens de kategorier, der er numerisk for små er markeret med rødt. De resterende sorte kategorier kan vi ikke med rimelighed udtale os om, da der
hverken er tale om signifikante over- eller underrepræsentationer. Desuden er de førnævnte kategorier, som ikke lever op til kravet om minimum 5 respondenter i hver celle, overstreget.
Helt overordnet betragtet kan man se to tilnærmelsesvise diagonale linjer i tabel 13.3, der antyder
en interessant sammenhæng mellem ’indkomst’ og ’selvvurderet helbred’. Den første linje går fra
’virkelig godt’ og ’under 200.000 kr.’ til ’meget dårligt’ og ’600.000 kr. og derover’. Den anden
linje går omvendt fra ’meget dårligt’ og ’under 200.000 kr. til ’virkelig godt’ og ’600.000 kr. og
derover’. Disse linjer kan indikere en tendens til, at personer, der tjener relativt få penge, generelt
vurderer deres helbred dårligere end personer, der tjener relativt mange penge. Det ses således, at
der er en klar overrepræsentation af respondenter i ’under 200.000 kr.’ i kategorierne ’nogenlunde’,
’dårligt’ og ’meget dårligt helbred’. Samtidig er respondenterne med et ’nogenlunde’ og ’dårligt
helbred’ markant underrepræsenteret for henholdsvis ’300.000-399.999 kr.’ og ’400.000-499.999
kr.’ samt indkomstkategorierne derover. Omvendt er respondenter med et ’virkelig godt helbred’
signifikant overrepræsenteret i indkomstkategorierne fra ’400.000-499.999 kr.’ og opefter, mens
respondenter med en indkomst på ’under 200.000 kr.’ er underrepræsenteret i forhold til at have et
’virkelig godt’ og ’godt helbred’.
Med vores χ2-test for uafhængighed og enkeltcelletest må vi forkaste vores H0-hypotese og tro på
vores H1-hypotese om ikke-uafhængighed. Hermed kan vi ikke afkræfte vores supplerende empiriske hypotese. Det tyder altså på, at der er en statistisk sammenhæng mellem ’indkomst’ og selvvurderet helbred’, idet personer med en relativ lav indkomst generelt vurderer deres helbred dårligere
end personer med en relativ høj indkomst. Vi kan dog ikke statistisk udtale os om et bestemt kausalitetsforhold. Hvis man har det teoretiske udgangspunkt for øje, tyder alle vores statiske test dog på,
at den enkeltes helbred er påvirkeligt af ’nære venskaber’ og ’indkomst’ – eller i Bourdieuske termer; social og økonomisk kapital. Dette vil vi uddybe nærmere i den kommende diskussion, hvor
vores empiriske analyse sammenholdes med den sociologiske teori.
64
14. Diskussion
14.1 Empiriske resultater
I det følgende vil vi opridse de væsentligste resultater, som vi har fundet ved brug af de statistiske
værktøjer. Først har vi kategoriseret vores to udvalgte variabler; ’nære venskaber’ og ’selvvurderet
helbred’. For ’nære venskaber’ har vi fundet ud af, at populationen med stor sandsynlighed ligger
inden for et interval plus/minus 1 procentpoint fra værdien i stikprøven. Den består af 86,39% respondenter med ’nære venskaber’ og 13,61% ’uden nære venskaber’. Det selvvurderede helbred
ligger hos langt de fleste respondenter i den gode ende: 40,18% har et ’virkelig godt helbred’ og
40,06% har et ’godt helbred’. Kun 4,10% og 1,27% har henholdsvis et ’dårligt’ eller ’meget dårligt
helbred’. I midterkategorien er 14,40% placeret med et ’nogenlunde helbred’.
Efter kategoriseringen har vi testet om vores stikprøve kan siges at være repræsentativ i forhold til
den viden, vi har om populationen fra Danmarks Statistik. Vi har fundet ud af, at kønsfordelingen
med et 5%-signifikansniveau er repræsentativ for population. Men med hensyn til baggrundsvariablen alder har vi fundet, at stikprøven ikke er repræsentativ for populationen inden for den usikkerhedsgrænse, vi er villige til at acceptere. Det samme gør sig gældende for indkomst. Da disse tre
parametre alle er væsentlige årsager til social differentiering i den sociologiske teori, er det problematisk, at der for to af disse ikke er tale om repræsentativitet. Derudover kan der også være andre
socioøkonomiske faktorer, som stikprøven ikke er repræsentativ for. Man skal huske på, at selvom
stikprøven er repræsentativ for køn, er det ikke sikkert den er det, hvis man betragter køn sammen
med andre parametre. Det har ikke været muligt for os at lave repræsentativitetstest på vores udvalgte variabler for analysen, da information om disse ikke kan findes i forhold til populationen.
I den egentlige test af vores empiriske hypotese har det vist sig, at der er en signifikant forskel i
’selvvurderet helbred’ mellem dem med ’nære venskaber’ og dem ’uden nære venskaber’. Således
har dem med ’nære venskaber’ vist sig generelt at have et bedre helbred end dem ’uden nære venskaber’. Dette underbygger vores teoretiske hypotese om, at der er en sammenhæng mellem social
kapital og helbred. Derudover har vi valgt at undersøge om der også er en sammenhæng mellem
’indkomst’ og ’selvvurderet helbred’. Der har vist sig at være en tendens til, at grupper med en lavere ’indkomst’ er signifikant overrepræsenteret i forhold til ’dårligt helbred’, og underrepræsenteret i
forhold til ’godt helbred’ sammenlignet med de bedre økonomisk stillede. Der er dog en statistisk
65
usikkerhed, idet der er for få mennesker i nogle af kategorierne til at vi med rimelighed kan udtale
os. Vi har altså igennem vores analyse kunne påvise en tendens til, at social såvel som økonomisk
kapital influerer menneskers helbred. Men i og med vores stikprøve på en række parametre ikke er
repræsentativ, kan vi ikke uden problemer overføre denne viden til populationen.
Derudover kan vi problematisere vores operationalisering. Vi har valgt at bruge ’nære venskaber’
som et udtryk for social kapital. Bourdieus begreb om social kapital omfatter mange aspekter, der er
afgørende for mængden af de ressourcer den enkelte opnår gennem dennes netværk. Bourdieu
fremhæver, at mængden af ressourcer både afgøres af kvaliteten såvel som kvantiteten. Vi har, som
sagt, valgt at fokusere på kvaliteten i form af, dét at have mindst én at tale om personlige problemer
med. Men en del andre aspekter af den enkeltes sociale kapital kan også tænkes at påvirke helbredsniveauet. Vi har blandt andet berørt, at ens netværk kan skaffe én en særlig brugbar viden i
forhold til helbred, og ikke mindst kan ens mere forudbestemte relationer så som forældre have en
stor betydning for ens helbredsniveau. Men dét, som vi indfanger med vores valgte variabel, er en
form for aktuel social kapital, idet der spørges til ’nære venskaber’ på interviewtidspunktet, hvilket
også gør sig gældende for ’selvvurderet helbred’. Derudover vurderer vi, at dét at have mindst en at
tale om personlige problemer med, er en form for social kapital, der må være særlig relevant i forhold til selvvurderet helbred. Man kan selvfølgelig også sætte spørgsmålstegn ved ’selvvurderet
helbred’ som mål for helbredsniveauet blandt danskerne. Men i henhold til Nettletons betragtninger
(jf. afsnit 2), mener vi det er det bedste mål for dette.
Opsummerende kan man sige, at der er en række problematikker i forhold til repræsentativiteten og
operationaliseringen, der ikke gør os i stand til at generalisere vores resultater til hele populationen
uden at tage nogle forbehold. Men der ser ud til at være en tendens til et sammenfald mellem social
kapital og helbred, hvilket da også underbygges af teorien. I de følgende afsnit vil vi diskutere nogle interessante aspekter, der knytter sig til vores problemformulering. Først vil vi diskutere kausalitetsforholdet mellem social kapital og selvvurderet helbred, som er væsentligt i forståelsen af vores
problemformulering.
66
14.2 Kausalitetsforhold mellem social kapital og helbred
Ud fra vores statistiske analyseresultater af nære venskaber og selvvurderet helbred ved vi nu, at der
er en sammenhæng mellem social kapital og helbred. Men hvori består denne sammenhæng? Hvilken form for kausalitet har vi egentlig med at gøre? Begrebet kausalitet refererer her til forholdet
mellem årsag og virkning. I denne opgave har vi indtil nu fokuseret på den sociale kapital som årsag og helbredet som en virkning heraf, men er kausalitetsforholdet i virkeligheden omvendt? I det
følgende vil vi kort diskutere, hvilke(t) kausalitetsforhold, der kan være tale om. Da vi ikke kan
konkludere noget om kausalitet på baggrund af vores statistiske analyse, tager denne diskussion
udelukkende udgangspunkt i teoretiske overvejelser.
Indenfor både den empiriske og den teoretiske sociologi fokuseres der hovedsagligt på et kausalitetsforhold, hvor menneskets sociale ressourcer eller mangel på samme ses som årsagen til et bestemt helbredsniveau. En række studier har således afdækket, hvilken betydning sociale relationer
har for en række fysiske og psykiske sygdomme såsom infektionssygdomme, kræft og mentale lidelser. Dog er forskningen på dette område så forholdsvis ny, at der stadig er mange ubesvarede
spørgsmål i forhold til at forstå sammenhængen mellem sociale relationer og helbred (Lund et al.
2002:87). Det er især kausalitetsforholdet med helbred som årsag, der står ubelyst hen, idet færre
studier afdækker denne sammenhæng (Lund et al. 2002:100). Alligevel kan man forestille sig, at
helbredet kan være af stor betydning for den enkeltes sociale kapital. Hvis et menneske for eksempel rammes af sygdom, kan det forhindre vedligeholdelsen af kontakten til familie og venner. Omvendt kan sygdommen også føre familie og venner endnu tættere på hinanden (ibid.). Helbredet kan
altså påvirke den enkeltes sociale kapital både negativt og positivt, hvilket vi senere vil uddybe.
I virkeligheden er der måske nok snarere tale om et dobbeltrettet kausalitetsforhold mellem social
kapital og helbred ligesom det er tilfældet med sammenhængen mellem sygdomme og indkomst.
Denne relation er en form for vekselvirkning, idet sygdomme både kan være forårsaget af og fremme en lav indkomst (Diderichsen 2011:359). Man kan således argumentere for, at et dårligt helbred
både kan være en effekt af og en årsag til en lav social kapital, og at det samme gør sig gældende
for relationen mellem et godt helbred og en høj social kapital. I en belysning af sammenhængen
mellem social kapital og helbred bør man derfor være opmærksom på, at kausaliteten ikke udelukkende går fra social kapital til helbred.
67
14.3 Helbred som årsag til social eksklusion?
I det følgende vil vi beskrive og diskutere det modsatte kausalforhold – hvordan et individs helbred
har betydning for dets sociale relationer og dermed mængde af social kapital. Dette gør vi ud fra
begrebet social eksklusion, der må siges at være den yderste sociale konsekvens af et dårligt helbred.
Social eksklusion er en betegnelse for de socialt udsatte individer, der på en eller flere områder lever på kanten af eller uden for samfundet (Andersen et al. 2011:211). Der er både synlige og usynlige socialt ekskluderede, og der er en stor fare for at overse de mindre synlige – eksempelvis førtidspensionister – da fokus ofte er på de synlige – herunder hjemløse og stofmisbrugere (Andersen
et al. 2011:227). Social eksklusion er ensbetydende med en mangel på ressourcer samt manglende
muligheder for at deltage i en række normale sociale relationer og aktiviteter. Et menneske siges
således at være ekskluderet, hvis det ikke deltager i sociale relationer og i samfundet generelt (Andersen et al. 2011:230). Indekset for inklusion og eksklusion består af forskellige elementer indenfor blandt andet politisk deltagelse, helbred og sociale relationer (ibid.).
I dagens Danmark er det en meget begrænset andel af befolkningen, der er socialt ekskluderet. Men
hvordan bliver et menneske i et velfærdssamfund som Danmark ekskluderet, og hvilke faktorer
spiller ind, når et menneske ekskluderes fra det sociale liv? Der er forskellige grunde til, at man
bliver socialt ekskluderet. Social eksklusion kan bunde i en opvækst under socialt belastede forhold.
Det har vist sig, at der er en klar sammenhæng mellem en problematisk opvækst og social eksklusion senere i livet (Larsen 2005 i Larsen 2009:31f), men disse tilfælde udgør kun en mindre del af de
socialt ekskluderede. En anden årsag til eksklusion er sociale begivenheder, der finder sted i voksenlivet, herunder blandt andet langvarig sygdom, mens den tredje årsag er bundet op på placering i
sociale, økonomiske og kulturelle hierarkier (ibid.). Den mest centrale bagvedliggende faktor for
social eksklusion er dog langtidsledighed og arbejdsløshed, da den arbejdsløse her ekskluderes fra
arbejdsmarkedet (Andersen et al. 2011:227). Andre vigtige socioøkonomiske faktorer for eksklusion er blandt andet lav indkomst, kort eller ingen uddannelse, hjemløshed og/eller svagt helbred
(ibid.). Netop den sidstnævnte faktor, dårligt helbred, er den faktor, vi i det følgende vil uddybe.
Når et menneske rammes af en længerevarende eller livstruende sygdom, får sygdommen både betydning for personens helbred og samtidig store konsekvenser for livskvaliteten i øvrigt. Et dårligt
helbred kan først og fremmest føre til arbejdsløshed og reducere muligheden for efterfølgende at
68
finde et nyt arbejde (Larsen 2009:22), hvilket kan resultere i dårlige økonomiske forhold og manglende kontakt til kollegaer. Hvis den syge bliver fyret eller må opgive at arbejde af helbredsmæssige
årsager, bliver han eller hun på denne måde ekskluderet fra arbejdsmarkedet. Men et ringe helbred
kan også betyde, at det bliver sværere at bevare et socialt netværk. Det ses, når den syge af helbredsmæssige årsager ikke længere kan opretholde en jævnlig kontakt til venner og familie, idet
”opretholdelsen af gensidig anerkendelse kræver et materielt og mentalt overskud til at være noget
for andre end sig selv”, som John Andersen og Jørgen Elm Larsen skriver (Andersen et al.
2011:233). De sociale konsekvenser, der skyldes sygdom og dårligt helbred, er således et ringere og
ustabilt socialt netværk, og dette kan få konsekvenser for en persons mængde af sociale kapital.
Med Bourdieu in mente kan man argumentere for, at den syge har en lavere social kapital end en
velfungerende og rask person, der uden problemer kan pleje sit netværk. Dette kan i yderste konsekvens føre til, at vedkommende bliver socialt ekskluderet. Det er dog vigtigt at pointere, at det er de
færreste i Danmark, der decideret er socialt ekskluderet. Der kan være tale om, at sygdom og dårligt
helbred kan have en betydning for ens sociale liv og dermed sociale kapital, men det er problematisk at sidestille lav social kapital med social eksklusion.
Politisk diskuterede man tidligere social eksklusion i forbindelse med arbejds- og boligproblemer,
og tillagde noget af skylden en fejlagtig socialpolitik, men i 1990’erne begyndte politikerne i stedet
at betone individets rolle og ansvar for egen situation (Järvinen 2011:238). Dette kan ses i sammenhæng med det postmoderne samfunds stigende individualisering, som vi kommer ind på i næste
afsnit.
14.4 Helbred og refleksivitet i det senmoderne samfund
I hvor vid udstrækning er vi mennesker og vores valg determineret af strukturer? Og i hvilken grad
har vi en fri vilje til at handle i forhold til vores helbred? Sociologerne, Ulrich Beck og Anthony
Giddens, har begge formuleret teorier om en udpræget individualisering i senmoderniteten. I det
følgende vil vi diskutere netop Beck og Giddens i forhold til individualisme, refleksivitet og sundhedsadfærd samt stille dette op imod Bourdieus teori.
I den Bourdieuske ontologi er strukturer og reproduktion af disse i vid udstrækning determinerende
for det enkelte individ - her kan, jf. afsnit 3, i flæng nævnes habitus, positionering i det sociale rum,
kumulation af diverse kapitalformer og reproduktionsmekanismer. Bourdieu kalder dog selv sit
69
arbejde for ’konstruktivistisk strukturalisme’, idet han bestræber sig på at distancere sig fra de mest
rigide former for strukturalisme, som ikke levner noget råderum for aktivt handlende, selvbestemmende og selektive aktører (Järvinen 2007:363). Han indfører, i tråd med denne bestræbelse, mønsterbryderbegrebet, som betegner et individ, der aktivt handler imod den prædisponerede skæbne
som dets positionering i det sociale rum og habitus anslår – eksempelvis i forhold til sundhedsvalg
(Esmark 2006:78). Hvorvidt Bourdieu formår at bløde determinismen op i sin konstruktivistiske
strukturalisme stilles der spørgsmålstegn ved af hans kritikere, der mener, at han for skarpt fokuserer på magt og reproduktion og kun meget lidt på modmagt og forandring. Bourdieus agenter tillægges således kun meget lidt handlefrihed ligesom strukturforandringer forekommer meget trægt
(Järvinen 2007:363).
Et alternativ til denne tænkning af samfundet er Giddens' ’strukturationsteori’, hvori individ/struktur dikotomien ligeledes søges ophævet. Individet ses i denne forbindelse som et socialt
handlende væsen, hvis handlinger på en og samme tid konstitueres af og er konstituerende for de
sociale strukturer (Kaspersen 2007:432). Her ses agenten i det senmoderne som frit flydende og
selvskabende, der ikke, ligesom i det præmoderne samfund, har en fastlagt kurs determineret af
slægt, stand og klasse. Der er tale om et individualiseret samfund, hvori selvet bliver er refleksivt
projekt; individet opfinder og former selv sit sunde eller usunde liv. Sociale problemer ses således
ikke som en klasseskæbne, men som en individuel dysfunktion (Larsen 1999:97).
Hos Beck er der ligeledes tale om et refleksivt projekt i forlængelse af individualiseringen (Rasborg
2007:466). I sin teori om risikosamfundet hævder han desuden, at omfordeling af risici (onder),
defineret som utilsigtede konsekvenser af den menneskelige handlen for eksempel i forhold til miljø, erstatter rigdom (goder) (Beck 1997a:27-23; 1993:37 i Rasborg 2007:461). Beck mener, at risikosamfundet er et post-klassesamfund, idet risici principielt fordeler sig uden hensyn til sociale
faktorer (ibid.). Dog er det vigtigt at notere sig, at Beck ikke mener, at vi på grund af risikosamfundets indtræden, har frigjort os fra de stratifikationsmekanismer, der gjorde sig gældende for klassesamfundet, idet ”…rigdom akkumuleres for oven, risici for neden” (Beck 1997:48). Han mener, at
klassesamfundets uligheder gentages i risikosamfundet, da dét at være velstillet økonomisk samt at
besidde en uddannelse og et højt informationsniveau, betyder, at man har mulighed for at købe en
sikker bolig, fødevarer af høj kvalitet og undgå jobs, der involverer helbredsrisici (ibid.). Når senmodernitetsteoretikere bruges til at belyse sundhedsproblematikken er det derfor vigtigt at holde
70
den sidste pointe in mente – blot fordi vi indtræder i den refleksive fase af moderniteten, betyder det
ikke, at vi mennesker er frie til at vælge i alle henseender, idet vi er begrænsede af vores ressourcer
– eller i en Bourdieusk terminologi; kapital.
14.4.1. Sundhedsdiskurs og –politik i en dansk kontekst
I Danmark har der været en tradition for, at staten er forsigtige med at blande sig i befolkningens
sundhedsadfærd; tilsvarende er sygelighed- og dødelighedsraten i Danmark relativ høj (Diderichsen
2011:364). Sammenlignet med andre velstillede lande, både de der har en mere eller mindre udbygget velfærdsmodel og socialpolitik, placerer danskerne sig dårligere i forhold til middellevetid jf.
Forebyggelseskommisionens rapport ”Vi kan leve længere og sundere” fra 2009 (Diderichsen 2011:
365). Tendensen anslås at skyldes, at de øvrige lande har en mere veludbygget sundhedsfremmende
politik. Man har i Danmark så at sige vægtet borgernes personlige frihed til at vælge – i tråd med
tanker om refleksivitet og individualisering som berettet af Giddens og Beck. I et sådant perspektiv
er der dog en overhængende fare for at overse og derfor også miskende bagvedliggende strukturer
som bestemmende for sundhedsadfærd og helbred generelt.
Af kritikere er det polemisk blevet sagt, at dét, der tidligere blev betegnet som det miljømæssige og
dét, der drejede sig om forskelle i sociale levevilkår, nu angår det naturlige og de menneskeskabte
vilkår (Jensen et. al.: 2007). Ie. et individs helbredsproblemer ses som resultatet og konsekvensen af
den individuelle livsstil – man taler om deciderede livsstilssygdomme, der anslår, at sygdommene
er direkte forårsaget af individets livsstilsvalg og placerer dermed ansvaret for det gode helbred hos
den enkelte. Gentagne undersøgelser viser dog, at der ikke er tale om et arbitrært forhold mellem
social positionering og helbred, men derimod en påfaldende sammenhæng, hvorfor Bourdieus teori,
på trods af at mangle forandringsaspektet, fortsat er yderst relevant. Den senmoderne refleksive
frisættelse er ikke udbredt på samme måde og i samme omfang i alle sociale lag, hvilket skaber
risici for nye sociale differentieringer mellem ”refleksive vindere” og ”refleksive tabere” (Lasch
1994 i Larsen 2000: 33).
Her kan eksempelvis nævnes en nylig undersøgelse fra AE-rådet, der konstaterer, at de 25% rigeste
danske mænd har en middellevetid på 82 år og de 25% fattigste en middellevetid på 72,2 år (AErådet 1). Andre undersøgelser fra AE-rådet konstaterer ligeledes, at ufaglærte har en kortere middellevetid end de med uddannelse. Desuden forbruger ufaglærte mere medicin og benytter flere sund-
71
hedsydelser end de uddannede (AE-rådet 2). Tendensen er, som nævnt i det foregående afsnit og
som påvist af AE-rådets undersøgelser, at socialt velstillede generelt har et bedre sundhedsniveau
end de mindre socialt velstillede. Desuden tjener Bourdieus teori til, ud fra et magtsociologisk perspektiv, at forklare, hvordan de dominerendes virkelighed igennem symbolsk vold indlejres i de
dominerede jf. afsnit 3.. Og hvordan dét faktum, at flere mennesker føler sig som subjekter for deres eget liv, medfører en ikke-bevidst social fortrængning af strukturelle forhold. Politisk kan en
sådan diskurs medføre en negligering af indsatsen mod og forebyggelsen af social skævvridning på
sundhedsområdet.
15. Konklusion
Vi har i denne opgave belyst social kapital og dennes betydning for helbredet hos den enkelte.
Sundhedsforskning har før lagt særlig vægt på økonomiske faktorer i forhold til at ræsonnere ulighed i sundhed, men idet, at man har fået øjnene op for at andre parametre kan spille ind, er der i
nyere tid også blevet forsket i sociale relationers betydning for helbredet. Ved at trække på vores
empiri samt den gennemgåede teori i opgaven, er det nu muligt at svare på vores problemformulering, som lyder:
”Hvordan medvirker social kapital til at skabe ulighed i helbred?”
I teoridelen har vi belyst, hvordan forskning har vist, at modtageligheden for sygdomme er forøget
hos personer med få sociale relationer og en ringe grad af følelsesmæssig støtte. Desuden er det
påvist, at personer, der har et begrænset socialt netværk, også er længere tid om at blive raske, hvorfor gode relationer derfor er fordrende for menneskers sundhedsadfærd og generelle helbred. Med
udgangspunkt i Bourdieus begreb om social kapital – forstået som mængden og kvaliteten af ressourcer, en given agent opnår gennem sit netværk – har vi således forsøgt at afsøge om vi empirisk
kan finde en sammenhæng mellem mængden af social kapital i form af nære venskaber og helbred
udtrykt ved selvvurderet helbred. Efter at have foretaget tests af vores empiriske hypotese, har vi
fundet en klar sammenhæng mellem dem, der vurderer deres helbred virkelig godt eller godt og
dem, der har nære venskaber. Ligeledes har det vist sig, at dem, der ikke har nære venskaber, i høj
grad vurderer deres helbred dårligere end dem med nære venskaber. Dette bekræfter således, at der
er en signifikant ikke-uafhængighed mellem social kapital og helbred. Dog er vi bevidste om, at vi
må tage forbehold, når vi udtaler os om det generelle tilfælde grundet den manglende repræsentati-
72
vitet for stikprøven. Statistisk set kan vi heller ikke påvise noget om kausalitetsforhold. Vi er således opmærksomme på, at social kapital og helbred lige så godt kan påvirke hinanden gensidigt.
Men vores teoretiske udgangspunkt har været at beskrive hvorledes mængden af social kapital har
en betydning for helbredet, og hvorledes dette kan forklare ulighed i helbredsniveauet blandt danskere.
Vi har diskuteret, hvordan denne ulighed i helbred forekommer og reproduceres ud fra Bourdieus
teori om social reproduktion og social kapital. Med udgangspunkt i hans teoretiske begreber om
dispositioner, habitus og symbolsk vold kan man anskue, hvorledes hverdagspraktikker differentierer sociale grupper imellem og hvordan forskellige sociale positioner reproduceres over generationer. Gennem sociale netværk får mennesker adgang til ressourcer, som den enkelte kan trække på,
og som er tilgængelig for alle i den pågældende gruppe. Dette kan have betydning for den enkeltes
helbred, for eksempel kan netværk både befordre en sund og en usund livsstil. Det er dog vigtigt at
pointere, at opfattelser af, hvad der er det sunde og usunde kan variere i forhold til den sociale position. Man kan tale om en sundhedskultur, der indlejres hos den enkelte. Bourdieu beskriver, hvorledes der forekommer en social fortrængning i alle sociale lag. Med denne betragtning kan man trække en parallel til, hvordan ulighed i helbred stadig kan være udbredt på trods af sociale- og sundhedspolitiske indsatser for netop at bekæmpe dette.
16. Perspektivering
16.1 Adfærdsregulerende tiltag eller ej?
Vi så i 2007 indførslen af et rygeforbud på offentlige steder og forhøjelsen af minimumsalderen for
køb af stærk spiritus i 2011. Seneste eksempel på adfærdsregulerende lovgivning er indførslen af
fedtafgift på fødevarer i 2012. Man kan diskutere om den gavnlige effekt, som disse tiltag har haft i
andre lande, er direkte overførbar til en dansk sammenhæng, og hvor hurtigt denne effekt eventuelt
vil sætte ind. Dog kan man konstatere, at tiltagene tilsyneladende har haft en markant effekt i blandt
andet Australien og Frankrig (Diderichsen 2011:365). Man kan desuden konstatere, at middellevetiden i Danmark er støt stigende (Danmarks Statistik). En tendens, der formodentligt er hjulpet på
vej af den senere tids sundhedspolitiske tiltag.
73
Dog konstaterer en nylig opgørelse over danskernes sundhed fordelt på socialgrupper, at der fortsat
er et markant voksende skel mellem de socialt velstillede og de mindre socialt velstillede både hvad
angår rygning, kostvaner og motion (Den nationale sundhedsprofil 2010). I 2010 forekom rygning
således tre gange oftere hos dem med kort uddannelse sammenlignet dem med en lang uddannelse.
Der ses en tendens til, at oplysningskampagner rammer socialt skævt, idét de kun lader til at virke
på den højtuddannede del af befolkningen. Afgifter er derimod et bedre værktøj til at ramme den
udsatte del af befolkningen, typisk de lavtuddannede, da de oftest placerer sig i lavindkomstgruppen
og således er mere prisfølsomme. Ræsonnementet bag at vælge oplysningskampagner frem for adfærdsregulerende tiltag er, at disse giver den enkelte den nødvendige viden til at foretage ”det gode
valg” på egen hånd (Søgaard i Hansen 2011:15) – i tråd med Giddens og Becks teorier om refleksivitet (jf. afsnit 14.4).
Man kan dog, set i lyset af denne opgaves problemformulering, fristes til at spørge: Behandler vi
'sygdommen' eller blot symptomerne herpå ved at adfærdsregulere gennem afgifter på sundhedsområdet? Og i hvor vid udstrækning skal vi pålægge den enkelte at kunne foretage ”det gode valg” i
forhold til sit eget helbred?
74
17. Litteraturliste
17.1 Bøger
Andersen, John og Jørgen Elm Larsen 2011: ”Fattigdom og social eksklusion”, i Socialpolitik af
Møller, Iver Hornemann og Larsen, Jørgen Elm (red.), København: Hans Reitzel forlag, s. 211-232
Becker-Christensen, Christian og Gitte Hou Olsen 2007: Politikens dansk ordbog. Finland:
JP/Politikens Forlagshus
Bourdieu, Pierre 1986: ”The forms of Capital”, i John G. Richardson (red.): Handbook of Theory
and Research for the Sociology of Education. New York: Greenwood Press
Bourdieu, Pierre 1994: ”Socialt rum og symbolsk magt”, i Bourdieu, Pierre: Centrale tekster inden
for sociologi og kulturteori. København: Akademisk Forlag
Bredsdorff, Nils 2011: ”Socialkonstruktivisme”, i Sociologisk leksikon af Larsen, Steen Nepper og
Inge Kryger Pedersen (red.). København: Hans Reitzels Forlag: 631
Diderichsen, Finn 2011: ”Socialpolitik og sundhed”, i Socialpolitik af Møller, Iver Hornemann og
Larsen, Jørgen Elm (red.). København: Hans Reitzels Forlag: 359-372
Due, Pernille og Rikke Lund 2002: ”Sociale relationer og helbred”, i Medicinsk sociologi – samfund, sundhed og sygdom af Due, Pernille, Bjørn Evald Holstein, Lars Iversen og Tage Søndergård
Kristensen (red.). København: Munksgaard Danmark
Esmark, Kim 2006: ”Bourdieus uddannelsessociologi”, i Annick Prieur & Carsten Sestoft: Pierre
Bourdieu – en introduktion. København: Hans Reitzels forlag, s. 71-114
Hansen, Erik Jørgen 2003: Uddannelsessystemerne i et sociologisk perspektiv. København: Hans
Reitzels Forlag
75
Hansen, Erik Jørgen og Bjarne Hjorth Andersen 2009: Et sociologisk værktøj – Introduktion til den
kvantitative metode. København: Hans Reitzels Forlag
Järvinen, Margretha 2007: ”Pierre Bourdieu”, i Andersen, Heine og Lars Bo Kaspersen (red.):
Klassisk og moderne samfundsteori. København: Hans Reitzels Forlag.
Järvinen, Margretha 2011: ”Socialt udstødte”, i Socialpolitik af Møller, Iver Hornemann og Jørgen
Elm Larsen (red.) København: Hans Reitzel forlag, s. 237
Jensen, Bente, Kristian Larsen, Peter Koudahl og Gry Andsager 2007: Ulighed i børn og unges
sundhed – set i lyset af social kapital. København: Danmarks Pædagogiske Universitets Forlag
Kaspersen, Lars Bo: ”Anthony Giddens”, i Andersen, Heine og Lars Bo Kaspersen (red.): Klassisk
og moderne samfundsteori. København: Hans Reitzels Forlag.
Kristensen, Tage Søndergård 2002: ”Sygdom og årsager til sygdom”, i Medicinsk sociologi – samfund, sundhed og sygdom af Due, Pernille, Bjørn Evald Holstein, Lars Iversen og Tage Søndergård
Kristensen (red.). København, Munksgaard Danmark
Larsen, Jørgen Elm 2000: ”Klassebiografi og individuel biografi”, i Larsen, J. E., J. Lind og I.E
Møller (red.), Kontinuitet og Forandring. Frederiksberg: Samfundslitteratur.
Malchow-Møller, Nikolaj og Allan H. Würtz 2010: Indblik i statistik – for samfundsvidenskab. København: Hans Reitzels Forlag.
Nettleton, Sarah 2006: ”Introduction: The Changing Domians of the Sociology of Helath and Illness”, i Nettleton, S., The Sociology of Health and Illness. Cambridge: Polity Press. Kap. 1
Nettleton, Sarah 2006, ”The Social Construction of Medical Knowledge”, I Nettleton, S., The Sociology of Health and Illness. Cambridge: Polity Press. Kap. 2
76
Rasborg, Klaus 2011, ”Individualisering” i Sociologisk leksion af Larsen, Steen Nepper og Inge
Kryger Pedersen. København: Hans Reitzels forlag
Svendsen, Gert Tinggaard og Gunnas Lind Haase Svendsen 2006, ”Social kapital – en introduktion”. København: Hans Reitzels Forlag
17.2 Rapporter
Andersen, Bjarne Hjort 2003: ”Bortfaldets omfang, skævhed og betydning” i Udvikling i befolkningens levekår over et kvart århundrede (rapport), København: SFI
Christensen, Anne Illemann, Michael Davidsen, David Ekholm, Stig Elberg Hansen, Maria Holst,
Knud Juel 2011: ”Den nationale sundhedsprofil 2010 – hvordan har du det?”
København: Sundhedsstyrelsen
17.3 Artikler
Hansen, Theis Holtz 2012: ”Afgifter øger ligheden” i Vision nr. 01/2012 Cevea (artikel). København: Cevea
Larsen, Jørgen Elm 1999: ”Fattigdom og social arv som konstruktion”, i Social Forskning, december 1999, s. 72-82
17.4 Internet
Arbejdernes Erhvervsråd: ”Social ulighed i levetiden” af Mikkel Baadsgaard (2012)
http://www.ae.dk/analyse/social-ulighed-levetiden (besøgt d. 10/5-2012)
Arbejdernes Erhvervsråd: ”Øget uddannelse giver danskerne et bedre helbred” af Jonas Schytz Juul
og Mie Dalskov Pihl (2011)
http://www.ae.dk/analyse/oget-uddannelse-giver-danskerne-et-bedre-helbred (besøgt d. 11/5-12)
Danmarks Statistik: ”BEF5 - Folketal pr 1 januar efter køn, alder og fødeland”, Statistikbanken
(http://www.dst.dk/da/Statistik/statistikbanken.aspx) (besøgt d. 1/5-2012)
Danmarks Statistik: ”INDKF4 – Familiernes indkomster efter område, enhed, socioøkonomiske
status og indkomsttype”, Statistikbanken (http://www.dst.dk/da/Statistik/statistikbanken.aspx) (besøgt d. 28/4-2012)
Systime: ”Rummet af sociale positioner og rummet af livsstile”
http://c-samf.systime.dk/typo3temp/pics/43b6c40822.png (besøgt d. 11/5-12)
77
18. Bilag
18.1 Do-file fra Stata
** fjerner observationer, som ikke er relevante i 2000
keep if inlist(RUNDKOMB,4,5,6,7) & v00_12! =.
** vi skal finde vores analyseudvalg. Så vi sletter respondenter der ikke
har svaret på en af vores variable.
keep if inlist(RUNDKOMB,4,5,6,7) & v00_366!=. & v00_16!=.
** dropper irrelevant I nære venner-variablen
drop if v00_366==9
** dropper irrelevant I selvvurdet helbred-variablen
drop if v00_16==8
drop if v00_16==9
**recode af indkomst i intervaller
recode v00_466 (1 2 3=1 "under 200.000 kr.") (4 5=2 "200.000 - 299.999 kr.")
(6 7=3 "300.000 - 399.999 kr.") (8=4 "400.000 - 499.999 kr.")///
(9=5 "500.000 - 599.999 kr.") (10=6 "600.000 kr. og derover") (77 88 99=.),
gen(katindkomst)
**recode af alder til intervaller
recode beregnet_alder_00 (min/29=1 "20-29 Âr") (30/39=2 "30-39 Âr") (40/49=3
"40-49 Âr") (50/59=4 "50-59 Âr") ///
(60/69=5 "60-69 Âr") (70/79=6 "70-79 Âr") (80/89=7 "80-89 Âr") (90/max=8 "90
Âr og derover") (else=.), gen(katalder)
** Chi2-test - helbred og kategoriseret indkomst
tab v00_16 katindkomst, cchi chi
**Installering af community-lavet funktion til stata - til enkeltcelletest
ssc install tab_chi
** Enkeltcelletest - helbred og kategoriseret indkomst
tabchi v00_16 katindkomst, a noo noe
78