Last ned PDF

Kom i gang med Stata for Windows på UiO - hurtigstart for begynnere
Hensikten med denne introduksjonen er å lære hvordan man kommer raskt i gang med
grunnleggende funksjoner i Stata. Teksten er tilpasset statistikk-tilbudet ved UiO og starter
med en beskrivelse av hva som skal til for å kjøre programvaren på egen PC eller fra en
server. Hvis du allerede har siste versjon av Stata installert, kan du hoppe over de første
avsnittene.
Installere på egen datamaskin?
Hvis du har planer om å bruke Stata ofte, på kontoret eller hjemme, er det anbefalt å ha
programmet installert på egen datamaskin. Alternativt, om det er ønskelig å prøve i en kort
periode / eller man har behov for Stata en gang i mellom, kan det enkelt startes fra en
Windowsbasert server. Dette krever ikke installasjon av programvaren (se informasjon om
statistikkservere ved UiO).
Her følger noen enkle punkter for å få programmet installert på egen Pc:
1. Les informasjonen om siste versjon av Stata i programvarekatalogen. Se
lisensbetingelse om du har rett til lisens fra UiO. Ansatte ved UiO og
doktorgradsstudenter skal ha dette.
2. Send en e-post til [email protected] hvor du ber om at din bruker blir medlem
av filgruppene for Stata: Stata-users, p-Stata32.
3. For installering på UiO-kontormaskin bør du ta kontakt med lokal IT-ansvarlig. De er
behjelpelig med selve installeringen.
Åpne Stata
Når programmet er ferdig installert kan du åpne programmet ved å klikke på Start → All
Programs → Stata →Stata[versjon]. Om du får opp et skjermbilde som ligner på dette, så er
du i gang:
Dette er hovedvinduet/utgangspunktet for å arbeide i Stata. Legg merke til at grensesnittet er
delt inn i 4 vinduer. I det største (øverst til høyre) vises resultater og diverse informasjon
(output). Under dette (nederst til høyre) finner du kommandofeltet. Dette brukes til å skrive
kommandoer til programmet. Det meste av funksjonalitet i Stata kan også kjøres fra pek-ogklikk menyer som i standard Windows programmer. Menyene finner du på knapperaden
øverst i vinduet og som nedtrekk.
I vinduet øverst til venstre vises tidligere utførte kommandoer (røde=feil, svarte=vellykkede).
Nederst til høyre vises variablene som hører til datasettet. Nedenfor tar vi for oss de
vanligste måtene å legge inn dataene i Stata.
Hvordan få dataene inn i Stata?
Det er 3 hovedmåter å hente data inn i Stata:
1. Legge inn data manuelt ved å taste de direkte inn i programmets „data editor‟.
2. Importere data som er opprettet av et annet program (for eksempel SPSS, nettskjema
eller Excel).
3. Lese inn et datasett som er tidligere lagret i Stata.
I denne veiledningen vil vi bruke import-alternativet som et eksempel. Eksempeldata kan
lastes ned på adressen
http://www.uio.no/tjenester/it/forskning/statistikk/hjelp/eksempel_skostr.xls
De fleste datasett fra kvantitative undersøkelser kan lagres som enkle tekstfiler (for
eksempel .csv .txt) eller i Excel format ( .xls). Men det er gjerne nødvendig å gjøre noen
forberedelser før man importerer dataene til Stata.
Tips: Hvis rådataene er registret i ett Excel regneark er det lurt å ta en sjekk om det er en rad
(gjerne rad 1) med tekst som definerer innholdet i kolonnene. For å kunne importere dataene
riktig, trenger Stata en matrise eller tabell hvor første rad starter med en beskrivende
merkelapp. Merkelappene kan for eksempel være respondent ID og navn på variabler. Det
bør ikke være noen tomme rader, blanke kolonner eller noen merkelapper med identisk navn.
Nedenfor er et eksempel på et riktig formatert datasett i Excel.
Variablene er her organisert i kolonner og respondenter på radene. Hver variabel har mer
enn en skåre/verdi. Husk at de beskrivende merkelappene (vist i fete typer) bør være på rad
1 i tabellen.
Når man har åpnet datasettet i Excel, som vist ovenfor, kan det enkelt kopieres over i Stata.
Marker dataene i Excel ved å trykke ctrl+a og deretter ctrl+c. I Stata trykker du på knappen
„Data Editor (edit)‟ på menylinjen:
. Du får da opp en databehandler som ligner på et
regneark. Trykk ctrl+v for å lime inn dataene du har kopiert (eller bruk menyvalget edit –>
paste). Hvis du får følgende melding, trykk på valget “Treat first raw as variable names”:
Første raden vil da bli definert som variabelnavn i Stata. Hvis ikke første raden i det
importerte regnearket inneholder variabelnavn vil kolonnene navngis automatisk som var1,
var2, var3 etc. Disse navnene kan endres i etterkant.
Om alt har gått bra, skal datasettet nå se slik ut:
Nå kan du lukke „Data Editor‟ ved å trykke på File -> Exit (eller krysset øverst i høyre hjørnet).
Tilbake i hovedvinduet til Stata vil du se at variablene er listet opp nederst til venstre:
Du kan også se fra informasjonen i høyre vindu at operasjonen var vellykket. 5 variabler og
13 observasjoner er limt inn i „data editor‟. Nå kan du lagre datasettet ved å trykke på
menyvalget file -> save. Gi filen et passende navn. Informasjonsvinduet vil nå vise
kommandoen som ble utført:
En annen vanlig måte å hente data inn i Stata er og importere fra en komma- eller
tabseparert tekst-fil (.cvs). For eksempel hvis en undersøkelse er foretatt i en skjemabasert
datainnsamlingsapplikasjon (som Nettskjema ved UiO) kan dataene som regel eksporteres i
tabseparert tekst fil. For å importere slike til Stata gå til File -> Import -> ASCII data created
from spread sheet. Hvis dataene er eksportert fra Nettskjema, velg „Tab-delimited data‟.
Kjør enkle rutiner i Stata
Når datasettet er riktig lest inn i Stata, kan vi begynne å kjøre noen enkle statistiske rutiner
og visualiseringer. De fleste statistiske rutiner i Stata kan kjøres både fra kommando-vinduet
og fra grafiske menyer. Med litt øvelse, kan det være raskere å bruke kommandoer enn å
klikke seg rem i menysystemet. For å være sikker på at du begynner på et ubesudlet
datasett, skriv først inn følgende (i kommandovinduet) og trykk „Enter‟:
clear all
Åpne deretter datasettet (file – open). For å få en generell oversikt/beskrivelse av datasettet
skriv inn kommandoen (kan også utføres med menyvalgene Data -> Describe data in
memory).
describe
Oversiktene fra eksempelet ser da slik ut:
For å kjøre enkel beskrivende statistikk (summering av gjennomsnitt) tast inn kommandoen
(menyvalg Data - > Describe data -> Summary statistics) :
summarize
Fra tabellen kan vi for eksempel lese gjennomsnittlig skostørrelse og minimum/maksimum
verdier.
En enkel tabulering av frekvens kan kjøres med kommadoen tab variabelnavn (menyvalg
Statstitcs -> Tables -> Talbe of summary statistics (tabstat) > velg variabel ‘skostrrlse’ og
‘kjnn’ fra nedtrekkmeny, andre felter kan stå blanke):
tab skostrrelse kjnn
I tabellen ser vi frekvens av skostørrelser i utvalget, fordelt på kjønn:
Visualisering av skostørrelse fordelt på kjønn ved boxplot (menyvalg : Graphics -> Box plots >
velg ‘variables’ skostrrlse under fanen ‘main’. Under fanen ‘categories’ hak av for Group 1
og velg kjnn som ‘Groping variable’):
graph box skostrrelse, over(kjnn)
Oppsummering og veien videre
I denne veiledningen har vi tatt for oss hvordan man kommer raskt i gang med elementære
funksjoner i Stata. Nå er du godt i gang, og kan utforske mulighetene i programvaren ved å
klikke rundt i menyene. Under menyvalget „Help‟ vil du finne omfattende PDF-dokumentasjon.
For flere ressurser/hjelp og veiledning, se IT-støtte til statistikk ved UiO.