Nettverkstreff for kvalitet i medisinske laboratorier 9. november 2015 Spørreskjemaundersøkelser som kilde til informasjon om kvalitet Ingeborg Strømseng Sjetne, sykepleier ph.d., seniorforsker i Seksjon for brukeropplevd kvalitet Om brukerundersøkelser i nettverkstreffet: Egnede metoder for undersøkelser Hva er representative undersøkelser? Gode spørsmål og svaralternativer Svarandeler – Realistisk forventning – Representativitet – Bruk av resultatet når få har svart 2 1 Ulike innfallsvinkler til kvalitet Pasientopplevd kvalitet Administrativ kvalitet Profesjonell kvalitet Etter Øvretveit J og Aslaksen A. The quality journeys of six Norwegian hospitals .Den norske legeforening 1999. 3 Seksjon for brukeropplevd kvalitet Gjennomfører nasjonale undersøkelser på oppdrag fra Helse‐ og omsorgsdepartementet. Surveyene (kartleggingene) er utformet for å holde vitenskapelig standard og: Framskaffe data som er representative for hvert sykehus/institusjon Gjøre sammenlikninger Framskaffe data som kan brukes til kvalitetsindikatorer i det nasjonale kvalitetsindikatorsystemet Seksjonens forsknings‐ og utviklingsvirksomhet omfatter anvendt forskning, formidling og støtte til lokale undersøkelser. 4 2 Formål med de nasjonale undersøkelsene Samfunnsmessig legitimering og kontroll: gi allmennheten innsikt i helsetjenestens ytelser i samfunnsmessig og helsepolitisk sammenheng Virksomhetsstyring: verktøy for styring og ledelse i helsetjenesten Faglig kvalitetsforbedring: verktøy for kvalitetsforbedringsarbeid i helsetjenesten Støtte til forbrukervalg: informasjonskilde for pasienter og helsepersonell i valg mellom leverandører av helsetjenester 5 Klar problemstilling og forankring ‐ avgrensninger og inklusjonskriterier Hva ønsker vi å vite noe om? – Om hvem, ‐eller hva – Spesiell tid / tidsrom – Individer eller grupper Hvilke spørsmål skal resultatene gi svar på? – Utvikling over tid/sammenlikning med seg selv – Sammenlikning med andre Hvem skal ha nytte av resultatene? – – – – Pasienter/brukere Administrasjon Klinikk Spesielle yrkesgrupper 6 3 Hvorfor og hvordan vurdere spørreskjemadata Klassisk testteori – De observerte skårene inneholder «sann» verdi og støy • Vi ønsker så lite støy som mulig Moderne testteori – Item response theory – Rasch‐analyse 7 Validitet (gyldighet) og reliabilitet (pålitelighet) Det er behov for beskrivelser av i hvilken grad spørsmålene /spørreskjemaet faktisk – Måler presist – Måler det vi har til hensikt å måle Valid og reliabel Valid, men ikke reliabel Reliabel, men ikke valid 8 4 Egnete metoder 9 KBUs «Standard» utviklingsprosess 1. UTVIKLE SPØRSMÅL Litteraturgjennomgang, kvalitative intervjuer, referansegruppe Sikre innholdsvaliditet 2. RESPONSFORMAT Hovedsakelig bruker vi femtrinns svarskala 3. EVALUERING AV SPØRSMÅL OG SPØRRESKJEMA Kognitive intervjuer Pilotundersøkelse Datakvalitet – manglende svar Dimensjonalitet – faktoranalyse 4. 5. RELIABILITET Intern konsistens Reproduserbarhet – test‐retest VALIDITET Sammenlikne data med eksist. teori og/eller forskningsfunn Sammenheng med generell tilfredshet, forventninger? Sammenheng med uønskete hendelser? 10 5 1. fase Åpne intervjuer Litteraturgjennomgang Referansegruppe Sikre brukerperspektivet, at innholdet er relevant for målgruppa – Innholdsvaliditet – «coverage» 11 Responsformat, eksempler Svært Nokså Litt Både- Litt Nokså Svært dårlig dårlig dårlig og bra bra bra Nesten alltid Helt enig En del av tiden Enig Sjelden Aldri Helt Uenig uenig 12 6 Responsformat ‐Skalering av spørsmål (Gjelder for alle undersøkelser ‐?) 13 Variablenes målenivå ‐1 Målenivå: Nominal (nasjonalitet, yrkesgruppe) Uttømmende og gjensidig utelukkende verdier Dikotomier er en spesiell variant (enten-eller) Har verdiene en gitt rangordning? Ja Målenivå: Ordinal (eks.Likertskala) Er det lik avstand mellom alle verdiene? Ja Målenivå: Intervall (temperatur i Celcius) Er det et absolutt nullpunkt? Ja Målenivå: Forholdstallsnivå (alder, vekt, prosent) 14 7 Variablenes målenivå ‐2 Tenk på at: Variablenes målenivå er avgjørende for hvilke regneoperasjoner som gir mening Man kan modifisere variabler etter datainnsamlingen ved å slå sammen verdier til større grupper, men ikke motsatt…… 15 Test av skjema ved muntlige intervjuer Kognitive intervjuer med en mindre gruppe informanter som speiler variasjonen i målgruppa – ”Kommunikasjonen” mellom spørreskjema og svarer prøves ut på personer som er ulike (alder, kjønn, helsetilstand) – Bruk av tid (tar tiden) – Entydige formuleringer, enkelt språk (tolvåringsnivå) – Fornuftige svarskalaer – Akseptabilitet (tiden det tar, følsomme tema og lignende) – Overflødige spørsmål? – Er spørsmålene relevante, er noen ekstra viktige? – Er det noe viktig som mangler? 16 8 Spørsmålsutvikling og utprøving Eks. Brukererfaringer i svangerskaps‐, fødsels‐ og barselomsorgen Gjennomført pilotundersøkelse (Ahus ) –publisert Vitenskapelig artikkel om randomisert datainnsamlingsmetode: besvarelser på papir vs via verdensveven 17 Dokumentasjon av forarbeid, eksempel fra svangerskap‐, føde‐, barselomsorgen 18 9 Metoder for å samle et utvalg trekking med kjent sannsynlighet – Enkel, tilfeldig – Stratifisert, tilfeldig – Klyngeutvelgelse Trekking uten kjent sannsynlighet – Bekvemmelighetsutvalg (convenience sampling), man tager hva man haver – Målrettet utvelgelse (purposive sampling) – Kvoteutvalg – Snøballutvalg, nettverk, kjede 19 Datainnsamling i nasjonale undersøkelser Tilfeldig trekking med kjent sannsynlighet av et utvalg brukere per institusjon i en gitt periode (fortløpende ved små institusjoner) Uttrekk vanligvis 400 personer fra PAS: – Kontaktinformasjon (for å sende ut spørreskjema) – Demografiske data, oppholdsdata og medisinske data (bakgrunnsinformasjon) Postale forespørsler som sendes ut noen uker etter konsultasjon/opphold 1‐3 purringer Eventuelt frafallsundersøkelse ‐ telefonintervju blant utvalg av ikke‐svarere 20 10 Datakilder og personvern Kontaktinformasjon og senere medisinske opplysninger og oppholdsdata hentes fra pasientadministrative system ved behandlende institusjon FS‐systemet For kvinner som har født: medisinsk fødselsregister, SSB Store krav til informasjonssikkerhet og personvern Tidkrevende prosesser med store krav til infrastruktur 21 Kontakt‐ og purremodus, eksempel fra svangerskap‐, føde‐, barselomsorgen 1.kontakt: brev med info og brukernavn/passord 1.purring: brev med info, brukernavn/passord og papirskjema 2.purring: brev med info, brukernavn/passord og papirskjema Oversatt skjema – På nettet kunne de veksle fritt – Engelsk papirskjema tilsendt på forespørsel • Vurder kost‐nytte 22 11 Svarermodus, eksempel fra svangerskap‐, føde‐, barselomsorgen Fra artikkelen som dokumenterer skjemaet, samlet svarerandel var 56% (😏) 23 Utledning av skalastruktur (EFA og teori) Care phase Factors a Final scales b Pregnancy Check-ups by a general practitioner Check-ups by a midwife Ultrasound scan Information during pregnancy care Birth Personal relationships in the delivery ward Resources and organization in the delivery ward Attention to partner in the delivery ward Postnatal stay Personal relationships during your postnatal stay Resources and organization during your postnatal stay Attention to partner during your postnatal stay Information about women’s health during your postnatal stay Information and guidance about your child during your postnatal stay Public health clinic Personal relationships in the public health clinic Resources and organization in the public health clinic Information about women’s health in the public health clinic Information about your child in the public health clinic a : Scales as suggested by EFA results b : Scales (indexes) after splitting factors by structure- and process categories or specific contents 24 12 Resultater 25 Å vurdere validitet Innholdsvaliditet – I hvilken grad innholdet i et instrument er en gyldig beskrivelse av det vi ønsker å undersøke. Intervjuer med målgruppen, sammenlikninger med aksepterte teoretiske definisjoner, oppsøkt litteratur, og liknende Konstruktvaliditet – I hvilken grad stemmer resultatet av målingene med det vi ville ventet ut fra f.eks. teoretiske betraktninger eller hypoteser om gruppeforskjeller? Blir vanligvis vurdert hvis en ikke har noe annet mål for fenomenet og dermed ikke kan vurdere kriterievaliditet. Kriterievaliditet – I hvilken grad er det samsvar mellom de nye måtene å måle på og andre mål for det vi ønsker å undersøke (”gullstandarder”)? Mokkink LB, et al (2010): The COSMIN study reached international consensus on taxonomy, terminology, and definitions of measurement properties for health‐related patient‐reported outcomes. J Clin Epidemiol. 2010 Jul;63(7):737‐45. 26 13 Validering er lokal ferskvare Kilde: Liza Donnelly, Drawing on humor for change, www.ted.com 27 Test av skalastruktur (CFA) Structural equation modeling – Root‐mean‐square error of approximation (RMSEA) =0,074 , denne og andre indikasjoner tyder på en rimelig godt tilpasset modell • Vår modell, utarbeidet på grunnlag av EFA og teori, synes å passe godt med de innsamlete dataene 28 14 COSMIN taxonomy of relationships of measurement properties Figur 1, side 542 i: Lidwine B, Mokkink LB, Terwee CB et al. The COSMIN checklist for assessing the methodological quality of studies on measurement properties of health status measurement instruments: an international Delphi study Qual Life Res (2010) 19:539–549 DOI 10.1007/s11136-0109606-8 29 Svarerandel 30 15 Svarerandel http://www.aapor.org/AAPORKentico/Communications/AAPOR-Journals/Standard-Definitions.aspx 31 Avgang og frafall (Etter Gustav Haraldsen, SSB) Bruttoutvalg Finner ikke Skal ikke Avgang Kan ikke Vil ikke Frafall Overtales Hopper av Partielt frafall 32 16 Den alltid bekymringsfulle svarprosenten …. Eksempel: Fastleger ble tilfeldig plassert i grupper med ulike purreprosedyrer Purreprosedyrer N Svarprosent To påminnelser Tre påminnelser til arbeidsadressen Tre påminnelser, den siste til privatadresse 68 77 67 49 60 60 33 Betydning av frafall Sporings‐ og rekrutteringsinnsatsen må veies mot betydningen av frafall De som er middels vanskelige å få tak i betyr ofte ikke så mye for resultatet. Det gjør derimot de som virkelig er vanskelige å få tak i. De som ikke kan svare eller ikke kan nås skaper større skjevhet enn de som ikke vil Frafall har størst konsekvenser i atferdsundersøkelser Personer med lav utdanning og lav sosial integrasjon er vanskeligst å rekruttere (Gustav Haraldsen, SSB) 34 17 Frafallsskjevhet, ulik svarsannsynlighet Svarprosent En pasientpopulasjon, med ulike diagnoser Undergrupper etter diagnose Eventuelt gjøre ikke-svarerintervjuer 35 Ikke‐svarer undersøkelse Lete etter systematiske forskjeller mellom svarere og ikke‐svarere med tanke på – Egenskaper • Alder • Kjønn • ….hva vi vet om begge gruppene – Erfaringer 36 18 Følger av lav svarprosent * Mest sannsynlig ubetydelige – Tidligere studier tilsier det – «wave‐analysis», forskjell på raskeste og seineste svarere? • Stat sign forskjell på sju av 16 indekser • De som svarte på første kontakt var mest positive, bortsett fra på én indeks (range 1,3 – 3,7) * Brukererfaringer med svangerskaps-, fødselsog barselomsorgen 37 Vekting for frafall Høyest svarsannsynlighet – 75,8% Norske kvinner, førstegangsfødende over 28,5 år Lavest svarsannsynlighet – 22,3% Kvinner født i landgruppe 2, født to eller flere barn tidligere 38 19 Edwards P, Roberts I, Clarke M, DiGuiseppi C, Pratap S, Wentz R, et al. Increasing response rates 39 to postal questionnaires: systematic review. BMJ 2002;324:1183. Fritekstkommentarer 40 20 Takk for oppmerksomheten! www.pasopp.no 41 Litteratur Dillman DA. Mail and Internet surveys : the tailored design method (2.ed.). New York: Wiley; 2000. Haraldsen G. Spørreskjemametodikk : etter kokebokmetoden. Oslo: Ad Notam Gyldendal; 1999. Edwards P, Roberts I, Clarke M, DiGuiseppi C, Pratap S, Wentz R, et al. Increasing response rates to postal questionnaires: systematic review. BMJ 2002;324:1183. 42 21
© Copyright 2024