Kom i gang med Stata for Windows på UiO - hurtigstart for begynnere Hensikten med denne introduksjonen er å lære hvordan man kommer raskt i gang med grunnleggende funksjoner i Stata. Teksten er tilpasset statistikk-tilbudet ved UiO og starter med en beskrivelse av hva som skal til for å kjøre programvaren på egen PC eller fra en server. Hvis du allerede har siste versjon av Stata installert, kan du hoppe over de første avsnittene. Installere på egen datamaskin? Hvis du har planer om å bruke Stata ofte, på kontoret eller hjemme, er det anbefalt å ha programmet installert på egen datamaskin. Alternativt, om det er ønskelig å prøve i en kort periode / eller man har behov for Stata en gang i mellom, kan det enkelt startes fra en Windowsbasert server. Dette krever ikke installasjon av programvaren (se informasjon om statistikkservere ved UiO). Her følger noen enkle punkter for å få programmet installert på egen Pc: 1. Les informasjonen om siste versjon av Stata i programvarekatalogen. Se lisensbetingelse om du har rett til lisens fra UiO. Ansatte ved UiO og doktorgradsstudenter skal ha dette. 2. Send en e-post til [email protected] hvor du ber om at din bruker blir medlem av filgruppene for Stata: Stata-users, p-Stata32. 3. For installering på UiO-kontormaskin bør du ta kontakt med lokal IT-ansvarlig. De er behjelpelig med selve installeringen. Åpne Stata Når programmet er ferdig installert kan du åpne programmet ved å klikke på Start → All Programs → Stata →Stata[versjon]. Om du får opp et skjermbilde som ligner på dette, så er du i gang: Dette er hovedvinduet/utgangspunktet for å arbeide i Stata. Legg merke til at grensesnittet er delt inn i 4 vinduer. I det største (øverst til høyre) vises resultater og diverse informasjon (output). Under dette (nederst til høyre) finner du kommandofeltet. Dette brukes til å skrive kommandoer til programmet. Det meste av funksjonalitet i Stata kan også kjøres fra pek-ogklikk menyer som i standard Windows programmer. Menyene finner du på knapperaden øverst i vinduet og som nedtrekk. I vinduet øverst til venstre vises tidligere utførte kommandoer (røde=feil, svarte=vellykkede). Nederst til høyre vises variablene som hører til datasettet. Nedenfor tar vi for oss de vanligste måtene å legge inn dataene i Stata. Hvordan få dataene inn i Stata? Det er 3 hovedmåter å hente data inn i Stata: 1. Legge inn data manuelt ved å taste de direkte inn i programmets „data editor‟. 2. Importere data som er opprettet av et annet program (for eksempel SPSS, nettskjema eller Excel). 3. Lese inn et datasett som er tidligere lagret i Stata. I denne veiledningen vil vi bruke import-alternativet som et eksempel. Eksempeldata kan lastes ned på adressen http://www.uio.no/tjenester/it/forskning/statistikk/hjelp/eksempel_skostr.xls De fleste datasett fra kvantitative undersøkelser kan lagres som enkle tekstfiler (for eksempel .csv .txt) eller i Excel format ( .xls). Men det er gjerne nødvendig å gjøre noen forberedelser før man importerer dataene til Stata. Tips: Hvis rådataene er registret i ett Excel regneark er det lurt å ta en sjekk om det er en rad (gjerne rad 1) med tekst som definerer innholdet i kolonnene. For å kunne importere dataene riktig, trenger Stata en matrise eller tabell hvor første rad starter med en beskrivende merkelapp. Merkelappene kan for eksempel være respondent ID og navn på variabler. Det bør ikke være noen tomme rader, blanke kolonner eller noen merkelapper med identisk navn. Nedenfor er et eksempel på et riktig formatert datasett i Excel. Variablene er her organisert i kolonner og respondenter på radene. Hver variabel har mer enn en skåre/verdi. Husk at de beskrivende merkelappene (vist i fete typer) bør være på rad 1 i tabellen. Når man har åpnet datasettet i Excel, som vist ovenfor, kan det enkelt kopieres over i Stata. Marker dataene i Excel ved å trykke ctrl+a og deretter ctrl+c. I Stata trykker du på knappen „Data Editor (edit)‟ på menylinjen: . Du får da opp en databehandler som ligner på et regneark. Trykk ctrl+v for å lime inn dataene du har kopiert (eller bruk menyvalget edit –> paste). Hvis du får følgende melding, trykk på valget “Treat first raw as variable names”: Første raden vil da bli definert som variabelnavn i Stata. Hvis ikke første raden i det importerte regnearket inneholder variabelnavn vil kolonnene navngis automatisk som var1, var2, var3 etc. Disse navnene kan endres i etterkant. Om alt har gått bra, skal datasettet nå se slik ut: Nå kan du lukke „Data Editor‟ ved å trykke på File -> Exit (eller krysset øverst i høyre hjørnet). Tilbake i hovedvinduet til Stata vil du se at variablene er listet opp nederst til venstre: Du kan også se fra informasjonen i høyre vindu at operasjonen var vellykket. 5 variabler og 13 observasjoner er limt inn i „data editor‟. Nå kan du lagre datasettet ved å trykke på menyvalget file -> save. Gi filen et passende navn. Informasjonsvinduet vil nå vise kommandoen som ble utført: En annen vanlig måte å hente data inn i Stata er og importere fra en komma- eller tabseparert tekst-fil (.cvs). For eksempel hvis en undersøkelse er foretatt i en skjemabasert datainnsamlingsapplikasjon (som Nettskjema ved UiO) kan dataene som regel eksporteres i tabseparert tekst fil. For å importere slike til Stata gå til File -> Import -> ASCII data created from spread sheet. Hvis dataene er eksportert fra Nettskjema, velg „Tab-delimited data‟. Kjør enkle rutiner i Stata Når datasettet er riktig lest inn i Stata, kan vi begynne å kjøre noen enkle statistiske rutiner og visualiseringer. De fleste statistiske rutiner i Stata kan kjøres både fra kommando-vinduet og fra grafiske menyer. Med litt øvelse, kan det være raskere å bruke kommandoer enn å klikke seg rem i menysystemet. For å være sikker på at du begynner på et ubesudlet datasett, skriv først inn følgende (i kommandovinduet) og trykk „Enter‟: clear all Åpne deretter datasettet (file – open). For å få en generell oversikt/beskrivelse av datasettet skriv inn kommandoen (kan også utføres med menyvalgene Data -> Describe data in memory). describe Oversiktene fra eksempelet ser da slik ut: For å kjøre enkel beskrivende statistikk (summering av gjennomsnitt) tast inn kommandoen (menyvalg Data - > Describe data -> Summary statistics) : summarize Fra tabellen kan vi for eksempel lese gjennomsnittlig skostørrelse og minimum/maksimum verdier. En enkel tabulering av frekvens kan kjøres med kommadoen tab variabelnavn (menyvalg Statstitcs -> Tables -> Talbe of summary statistics (tabstat) > velg variabel ‘skostrrlse’ og ‘kjnn’ fra nedtrekkmeny, andre felter kan stå blanke): tab skostrrelse kjnn I tabellen ser vi frekvens av skostørrelser i utvalget, fordelt på kjønn: Visualisering av skostørrelse fordelt på kjønn ved boxplot (menyvalg : Graphics -> Box plots > velg ‘variables’ skostrrlse under fanen ‘main’. Under fanen ‘categories’ hak av for Group 1 og velg kjnn som ‘Groping variable’): graph box skostrrelse, over(kjnn) Oppsummering og veien videre I denne veiledningen har vi tatt for oss hvordan man kommer raskt i gang med elementære funksjoner i Stata. Nå er du godt i gang, og kan utforske mulighetene i programvaren ved å klikke rundt i menyene. Under menyvalget „Help‟ vil du finne omfattende PDF-dokumentasjon. For flere ressurser/hjelp og veiledning, se IT-støtte til statistikk ved UiO.
© Copyright 2024