Stöd för rätt sjukskrivning – ett samverkansprojekt mellan Försäkringskassan och Sveriges Kommuner och Landsting Bilaga 5 Stöd för rätt sjukskrivning 2016 Prediktionsmodeller för sjukskrivningsduration Kristina Alexanderson Matteo Bottai Paolo Frumento Elin Hinas Kerstin Nilsson Enheten för biostatistik samt Sektionen för försäkringsmedicin Karolinska Institutet Stöd för rätt sjukskrivning Dnr SKL: 14/3621 2016-10-05 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration Sidan 2 av 55 Innehållsförteckning 1 Inledning ......................................................................................................................................... 3 2 Sammanfattning .............................................................................................................................. 3 3 I rapporten används följande förkortningar och begrepp ................................................................ 6 4 Inledning ......................................................................................................................................... 7 4.1 5 Syfte ........................................................................................................................................ 7 Material och metod ......................................................................................................................... 7 5.1 Data ......................................................................................................................................... 7 5.1.1 5.2 Två diagnoser; F43 och M75 ................................................................................................... 9 5.3 Socialstyrelsens försäkringsmedicinska beslutsstöd ............................................................... 9 5.3.1 F43 ................................................................................................................................... 9 5.3.2 M75 ............................................................................................................................... 10 5.4 Studiepopulationer................................................................................................................. 11 5.5 Variabler ................................................................................................................................ 11 5.5.1 Utfall.............................................................................................................................. 11 5.5.2 Prediktionsfaktorer i steg 1 i projektet .......................................................................... 12 5.5.3 Prediktionsfaktorer i steg 2 i projektet .......................................................................... 18 5.6 Analysmetoder....................................................................................................................... 21 5.6.1 6 Information i MiDAS ...................................................................................................... 8 Predictive models .......................................................................................................... 21 Resultat ......................................................................................................................................... 24 6.1 Prediction of SA spell for F43 and M75 diagnoses ............................................................... 24 6.2 A note on prediction .............................................................................................................. 24 6.2.1 Definition....................................................................................................................... 24 6.2.2 Predictive models .......................................................................................................... 24 6.3 Prediction models for F43 and M75 ...................................................................................... 25 6.3.1 Predictors ....................................................................................................................... 25 6.3.2 Predicting the final outcome of a spell .......................................................................... 26 6.3.3 Predicting the duration of SA for those who go back to work or other activity ............ 27 6.4 Prediction tools ...................................................................................................................... 29 7 Concluding remarks ...................................................................................................................... 31 8 Diskussion .................................................................................................................................... 32 9 Appendix I – Selected figures F43 ............................................................................................... 33 10 Appendix II – selected figures M75 ............................................................................................. 45 11 Referenser, i urval......................................................................................................................... 55 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson 1 2016-10-05 Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 3 av 55 Inledning Försäkringskassans prognoser visar att sjukskrivningarna ökar både i omfattning och i längd. Sjukskrivning är en viktig del av vård och behandling, men forskning visar också att långvariga sjukskrivningar kan leda till sämre hälsa, ekonomi och relationer. Idén bakom projektet Stöd för rätt sjukskrivning, SRS, är att förbättra för alla inblandade i sjukskrivnings- och rehabiliteringsprocessen, inklusive individen själv. Ett gemensamt IT-baserat bedömningsstöd kan bidra med ett samlat kunskapsunderlag för att läkare ska kunna utfärda läkarintyg med större träffsäkerhet samt hjälpa hälso- och sjukvården att identifiera individer som har behov av specifika eller samordnade insatser. I framtiden kan bedömningsstödet också användas som ett stöd för arbetsgivare och av individen själv för att kunna ta en aktiv del i sin egen rehabilitering. Förutsättningarna för att skapa ett bedömningsstöd utreddes i en förstudie 2014-2015. Då undersöktes bland annat vilken kunskap som fanns i forskningen om prognosfaktorer som påverkar sjukskrivningen, eftersom sådan kunskap kan ge mer träffsäkra prediktioner om sjukskrivningslängd och omfattning för en enskild individ. Under 2016 har projektet genomfört ytterligare utredningsarbete inom tre områden: Juridiska utredningar - förslag om ansvar och roller för bedömningsstödet, personuppgiftsansvar, ansvar för utveckling, drift och förvaltning samt ansvar för utveckling och förfining av bedömningsstödets prediktionsmodeller. Kostnads- och nyttoanalys - identifiera och jämföra kostnader med nyttor ur både ett kortoch långsiktigt samhällsekonomiskt perspektiv för ett bedömningsstöd infört i hälso- och sjukvården. Verksamhetsanalys – användarbehov och prototyptester, etisk analys, utredning om rehabiliteringsinsatser och insatsförteckning, fördjupad utredning om prediktiva modeller. Projektet har finansierats via Socialdepartementet genom överenskommelsen mellan regeringen och Sveriges Kommuner och Landsting, SKL, om en kvalitetssäker och effektiv sjukskrivningsoch rehabiliteringsprocess. SKL har ansvarat för projektet och har tillsammans med Försäkringskassan utgjort projektets styrgrupp. Utredningsarbetet påbörjades i januari 2016 och slutredovisning sker till socialdepartementet i oktober 2016. Utredningsarbetet har utförts av en arbetsgrupp med bred kompetens och med stor samlad erfarenhet av nationella e-hälsoprojekt. Delar av utredningsarbetet har utförts av och med forskare och utredare från Karolinska Institutet. Denna rapport redovisar endast en del av projektets arbete. Hela rapporten med en sammanfattning av resultatet går att beställa av [email protected]. Mer information om projektet Stöd för rätt sjukskrivning finns på SKL:s webbplats: http://skl.se/halsasjukvard/sjukskrivningochrehabilitering/sjukskrivningsmiljarden/rattsjukskrivningsto d.5229.html Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson 2 2016-10-05 Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 4 av 55 Sammanfattning I detta delprojekt, inom det övergripande SRS projektet, har data från sex rikstäckande register från tre myndigheter (Försäkringskassan, Socialstyrelsen och Statistiska centralbyrån) använts i analyser för att ta fram modeller för prediktion av längd av påbörjade sjukskrivningsfall. Uppdraget var att göra detta i två steg och för två olika diagnoser. Det första steget var att ta fram en modell innehållande de faktorer som en allmänläkare bedömdes kunna ha tillgång till, inom ramen för ett utökat SRS projekt, i mötet med patienten. Det andra steget var att ta fram en prediktionsmodell där ytterligare faktorer inkluderades, faktorer som i tidigare studier visats vara av betydelse för sjukskrivningsduration. De två studerade diagnoserna var "anpassningsstörningar och reaktion på svår stress" (F43) samt "sjukdomstillstånd i skulderled" (M75), det vill säga, dels en psykisk diagnos med ett mycket stort och ökande antal långa sjukskrivningar, dels en muskuloskeletal diagnos, även den med många sjukskrivningar. Samtliga personer i åldrarna 16-64 med ett nytt sådant sjukskrivningsfall som påbörjades under 2011 och som blev mer än 14 dagar långt inkluderades. Eftersom fokus skulle vara på sjukskrivningar där det första sjukintyget utfärdats av läkare inom primärvården exkluderades de personer som vid sjukskrivningens start var inlagda på sjukhus eller hade träffat en läkare på en specialiserad öppenvårdsklinik. För diagnosen F43 inkluderades drygt 28 000 personer och för M75 cirka 4 500 personer. I steg 1användes information om följande variabler: kön, ålder, månad sjukskrivningen påbörjades, sysselsättning, hel- eller deltidssjukskrivning i början av fallet, om personen samtidigt hade deltids sjuk- eller aktivitetsersättning samt tidigare sjukskrivningar respektive tidigare sjuk-eller aktivitetsersättning under ett år före respektive under två år före datum för det nya fallets start, generellt och i olika diagnoser. I steg 2 inkluderades såväl dessa som ytterligare variabler. De nya var: utbildningsnivå, födelseland, typ av boendekommun, familjesituation, civilstånd, typ av sektor personen arbetade inom samt typ av yrke, tidigare uppnått maxtid inom försäkringen respektive att tidigare ha fått sjukpenningen indragen. När det gäller tidigare sjukvård användes dessa variabler, dels för ett år före, dels för två år före datum för att det studerade fallet påbörjades: antal besök i specialiserad öppenvård, generellt och per diagnosgrupp, antal och duration av sjukhusinläggningar, generellt och per diagnosgrupp. Avancerade prediktionsmodeller användes för analyserna. Först skapades prediktionsmodeller där orsak till avslut av sjukskrivningsfallet predicerades. Därefter skapades modeller som predicerar längd på sjukskrivningsfallet endast för de fall som inte avslutades på grund av att sjukskrivningsfallet övergick till sjuk- eller aktivitetsersättning eller genom att personen avled, fyllde 65 år eller emigrerade. De framtagna prediktionsmodellerna gav ett korrekt resultat av prediktionerna för båda diagnoserna. Däremot var prediktionen svagare och hög precision fanns endast för vissa grupper. Orsaker till det kan vara flera, bland annat att båda diagnoserna innehåller ett flertal olika underdiagnoser, med förväntad stor skillnad i sjukskrivningsduration. De mest relevanta variablerna var sjukskrivningsmånad, sjukskrivningsgrad och tidigare sjukskrivning eller sjuk- eller aktivitetsersättning i samma diagnos. Användande av nettodagar istället för bruttodagar samt att inkludera information om diagnosspecifik tidigare sjukfrånvaro och vård, förbättrade prediktionsvärdet med 50-80 %. Ålder hade ett prediktionsvärde för diagnosen M75 men inte för F43. Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson 2016-10-05 Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 5 av 55 Prediktionsmodellen för estimering av sjukskrivningsduration bland personer som redan är sjukskrivna utvecklades. Den kan enkelt implementeras för datoranvändning. Grafiska modeller kan optimeras för olika användare, såsom läkare, rehabkoordinatorer, etcetera. Styrkor med modellen är att den baseras på mycket omfattande och reella data för samma typ av population som den kommer att appliceras på. Prediktionsmodellen som utvecklats kan användas vid olika situationer för att predicera framtida sjukfrånvaro för en person sjukskriven med en specifik diagnos. Den typ av data som använts i projektet är unika, även internationellt och kan användas för fördjupade analyser och för prediktion även av sjukskrivningsduration för personer sjukskrivna i andra diagnoser. Även data från andra register kan användas för detta ändamål, dock fanns det inte utrymme för detta inom projektets tidsram. I detta projekt har endast personer som faktiskt hade en pågående sjukskrivning som varat i mer än 14 dagar inkluderats. Det vore även av vikt att göra motsvarande analyser för personer som initialt har en viss diagnos (sjukdom eller skada) och inte är sjukskrivna, för att studera risk att bli sjukskriven korta eller långa perioder. Sådan kunskap efterfrågas från hälso- och sjukvården och behövs som underlag för att utveckla kunskapsbaserade preventiva åtgärder. Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson 3 2016-10-05 Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 6 av 55 I rapporten används följande förkortningar och begrepp Bruttodagar Antal dagar med ersättning från Försäkringskassan för sjukskrivning eller sjuk- och aktivitetsersättning F43 Diagnoskod i ICD-10 för diagnos "Anpassningsstörningar och reaktion på svår stress" Faktor Ett värde på en variabel, till exempel kvinna i variabeln kön FK Försäkringskassan H-region Indelning av kommuner, efter hur urbana de är, såsom i Storstad, Mellanstor stad eller Småorter ICD-10 International Classification of Diagnoses, version 10 (1) IMAS Insurance Medicine All Sweden; den databas projektet baseras på LISA Longitudinell Integrationsdatabas för Sjukförsäkrings- och Arbetsmarknads-studier; rikstäckande register administrerat av Statistiska centralbyrån M75 Diagnoskod i ICD-10 för diagnos " Sjukdomstillstånd i skulderled" MiDAS MikroData för Analys av Socialförsäkringen; rikstäckande register administrerat av Försäkringskassan Nettodagar Antal hela dagar med ersättning från Försäkringskassan för sjukskrivning eller sjuk- och aktivitetsersättning. Dagar med partiell frånvaro är hopslagna till hela dagar. SA Sjuk- och aktivitetsersättning, tidigare förtidspension Sensitivitet Andel sant positiva prediktioner Specificitet Andel sant negativa prediktioner SRS Stöd för rätt sjukskrivning; namn på det projekt som denna rapport ingår i Totala antalet dagar Antal dagar mellan anmälningsdagen och sista dagen med ersättning i ett sjukskrivningsfall Variabel En grupp faktorer som utesluter varandra, till exempel kön som består av faktorerna man och kvinna. Rapporten är delvis skriven på engelska. Abbreviations used in the English texts DP Disability pension SA Sickness absence 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson 4 Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 7 av 55 Inledning Detta delprojekt utgår dels från det arbete som gjorts i två tidigare delprojekt inom ramen för SRSprojektet avseende prediktion av fortsatt sjukskrivning bland personer som har påbörjat ett sjukskrivningsfall (2, 3), dels från diskussioner med SRS:s projektledningsgrupp. Projektet, som är tvärvetenskapligt, har genomförts i samarbete med forskare vid Enheten för biostatistik och vid Sektionen för försäkringsmedicin, Karolinska Institutet. Framför allt har följande sex personer vid Karolinska Institutet arbetat med projektet (i bokstavsordning): - Kristina Alexanderson, professor i socialförsäkring, Dr i medicinsk vetenskap, Sektionen för försäkringsmedicin, Institutionen för klinisk neurovetenskap (CNS) (projektledare; [email protected]) - Matteo Bottai, professor i biostatistik, PhD in biostatistics, Enheten för biostatistik, Institutet för miljömedicin (IMM) - Paolo Frumento, forskarassistent, PhD in statistics, Enheten för biostatistik (IMM) - Elin Hinas, statistiker, Sektionen för försäkringsmedicin (CNS) - Kerstin Nilsson, statistiker, Sektionen för försäkringsmedicin (CNS) - Petter Tinghög, forskarassistent, Fil dr, Sektionen för försäkringsmedicin (CNS) 4.1 Syfte Syftet med detta delprojekt var att utveckla prediktiva modeller avseende duration av sjukskrivningsfall i två olika sjukskrivningsdiagnoser. 5 Material och metod Detta projekt utgår dels från det arbete som tidigare gjorts i två delprojekt inom ramen för SRSprojektet avseende prediktion av fortsatt sjukskrivning bland personer som har påbörjat ett sjukskrivningsfall (2, 3), dels från diskussioner med SRS:s projektledningsgrupp. 5.1 Data Analyserna baseras på information från en databas inom projektet Insurance Medicine All Sweden (IMAS) som leds och administreras inom Sektionen för försäkringsmedicin, Karolinska Institutet. Databasen innehåller avidentifierade individdata länkade från flera olika rikstäckande register för samtliga personer i arbetsför ålder som registrerats som boende i Sverige vissa år. Projektet har godkänts av den Regionala etikprövningsnämnden i Stockholm. För detta projekt har data från följande sex register inom IMAS använts: Från Försäkringskassan: - MiDAS (MikroData för Analys av Socialförsäkringen) registret (4): information om sjukskrivningsfall som ersatts av Försäkringskassan under åren 2008-2014. Ur registret hämtades information om varje falls startdatum (startdatum 1/anmälningsdatum samt startdatum 2 vilket är den första dagen med ersättning från Försäkringskassan) och slutdatum, omfattning (grad av deltid eller om heltid), antal dagar med ersättning från Försäkringskassan (både brutto- och nettodagar), totala antalet dagar i fallet (inklusive dagar utan ersättning från Försäkringskassan), försäkradtyp (typ av sysselsättning) vid sjukskrivningsfallets start samt sjukskrivningsdiagnos (huvuddiagnosen i den första sjukskrivningsperioden i sjukskrivningsfallet). Motsvarande information om sjuk- och aktivitetsersättningar (tidigare kallat förtidspension eller sjukbidrag) inhämtades också från MiDAS. Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson 2016-10-05 Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 8 av 55 Detta innebär att information från både hel- och delfallsfiler i MiDAS har använts. - Försäkringskassans register över personer som under åren 2009-2011 uppnått maximal tid i sjukförsäkringen och datum för detta. - Försäkringskassans register över personer som fått sin sjukpenning indragen samt datum för detta under åren 2009-2011. Från Statistiska centralbyrån: - LISA-registret(5) (Longitudinell Integrationsdatabas för Sjukförsäkrings- och Arbetsmarknads-studier). Baserat på data från LISA har vi tagit fram information om följande sociodemografiska variabler för år 2011: ålder, kön, födelseland, högsta utbildningsnivå, yrke, sektor, familjesituation, civilstånd och H-region (baserat på boendekommun). Från Socialstyrelsen - Dödsorsaksregistret information om datum för död och dödsorsak 2010-2013. - Patientregistret, dels från Slutenvårdsregistret, vad avser information om tillfällen personer varit inlagda på sjukhus, avseende: datum, antal dagar, samt huvud- och bidiagnoser under åren 20082011, dels från Öppenvårdsregistret, vad avser: datum för läkarbesök i specialiserad öppenvård för olika diagnoser under åren 2008-2011 (Detta register innehåller inte information om besök i primärvården). 5.1.1 Information i MiDAS I MiDAS registreras sjukskrivningsfall där Försäkringskassan har betalat ut ersättning. Det innebär att för de flesta anställda, där arbetsgivaren betalar sjuklön under de första 14 dagarna i ett sjukskrivningsfall, får inte Försäkringskassan information om sjukskrivningsfallet om det inte överstiger 14 dagar. Därför registreras inte de flesta sjukskrivningsfall som är kortare än 15 dagar i MiDAS. För arbetslösa och vissa andra grupper för vilka Försäkringskassan betalar ut ersättning tidigare i sjukskrivningsfallet finns kortare fall registrerade i MiDAS. För att inte introducera en bias relaterat till dessa grupper inkluderades i denna rapports analyser endast sjukskrivningsfall som var längre än 14 dagar. För varje sjukskrivningsfall finns det två startdatum, dels dagen då personen sjukanmälde sig till sin arbetsplats alternativt till Försäkringskassan (startdatum 1/anmälningsdatum) och dels datum för den första dagen med ersättning från Försäkringskassan (startdatum 2). Tre variabler används för beskrivning av antal dagar i ett sjukskrivningsfall. Den första beskriver antalet dagar från anmälningsdagen till den sista dagen med ersättning, alltså då sjukskrivningsfallet avslutades, detta kallas här för totala antalet dagar i fallet. När data från MiDAS ”tvättades” slogs alla sjukskrivningsfall, som startade inom fem dagar efter att ett tidigare fall avslutats, samman med det tidigare fallet. Detta på grund av återinsjuknande regeln, som innebär att personen får ersättning från Försäkringskassan redan från dag 1 i det nya fallet. För sjukskrivningsfall med ersättningstyp "förebyggande sjukskrivning" användes 14 dagar som gräns för sammanslagning, detta på grund av sådana fall ofta upprepas inom det tidsintervallet. Vid beräkning av totala antalet dagar inkluderades inte de mellanliggande dagarna, det vill säga dagar utan ersättning från Försäkringskassan togs inte med. Den andra variabeln är antal bruttodagar, som beskriver antalet dagar med ersättning från Försäkringskassan. Dessa dagar är i de flesta fall lika med antalet dagar mellan den första dagen med ersättning (startdatum 2) och den sista dagen med ersättning (slutdatum), men det finns Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson 2016-10-05 Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 9 av 55 sjukskrivningsfall där det förekommer dagar mitt i fallet där ingen ersättning har utbetalats, detta på grund av till exempel uttagen semester eller fängelsestraff. Dessa dagar utan ersättning är inte medräknade i variabeln bruttodagar men de är medräknade i variabeln totala antalet dagar. I den tredje variabeln har antal bruttodagar räknats om till antalet nettodagar, det vill säga, antalet hela dagar med ersättning. Till exempel omräknas fyra bruttodagar med en omfattning om 25 % av heltid till en nettodag. Information om sjukskrivningsdiagnos från Försäkringskassans MiDAS databas finns endast på treställighetsnivå för ICD-10. Det innebär att information om sjukskrivningsdiagnoser på mer detaljerad nivå inte funnits tillgängligt i detta projekt, då utgångspunkten varit MiDAS. 5.2 Två diagnoser; F43 och M75 Sjukskrivningsfall i en psykisk och i en muskuloskeletal sjukskrivningsdiagnos har, utifrån uppdraget, analyserats. Efter diskussioner med SRS projektet valdes dels den diagnosgrupp som ökat mest; stressrelaterade psykiska besvär (F43 enligt ICD-10 (1)) och dels skulderbesvär (sjukdomstillstånd i skulderled; M75). Diagnosen F43 "Anpassningsstörningar och reaktion på svår stress" är en övergripande diagnoskategori som inkluderar bland annat följande diagnoser: akut stressreaktion, anpassningsstörning, posttraumatiskt stressyndrom och utmattningssyndrom. Diagnosen M75 "Sjukdomstillstånd i skulderled" inkluderar bland annat rotatorcuffsyndrom i skulderled och impingementsyndrom i skulderled. 5.3 Socialstyrelsens försäkringsmedicinska beslutsstöd Socialstyrelsens försäkringsmedicinska beslutsstöd (6) innehåller diagnosspecifika rekommendationer för båda valda diagnoserna, det vill säga för F43 och M75. 5.3.1 F43 Diagnosen F43 innehåller fem underdiagnoser. Socialstyrelsens diagnosspecifika försäkringsmedicinska beslutsstöd innehåller skilda rekommendationer för fyra av dessa underdiagnoser (se nedan) – dock inte för den femte, nämligen F43.9 "ospecificerad reaktion på svår stress". Som framgår av texterna nedan är troligtvis utmattningssyndrom (F43.8) den vanligaste sjukskrivningsdiagnosen bland de många långa sjukskrivningarna i diagnos F43. I beslutsstödet för F43-diagnoserna görs inte skillnad på rekommendationerna beroende på patientens typ av arbete. Akut stressreaktion - F43.0 "Arbete har normalt positiv effekt och sjukskrivning bör så långt möjligt undvikas. Arbetsförmågan kan vara helt eller delvis nedsatt i 2-4 veckor." Posttraumatiskt stressyndrom - F43.1 "Symtomens svårighetsgrad och varaktighet är vägledande vid bedömning av sjukskrivning. Stora individuella skillnader förekommer. Arbete kan ha en positiv effekt på symtombilden och sjukskrivning bör i sådana fall undvikas." Anpassningsstörning (livskris, sorgreaktion) - F43.2 "I normalfallet och i frånvaro av annan psykisk störning eller kroppslig sjukdom är arbetsförmågan inte eller endast obetydligt nedsatt och sjukskrivning är som regel inte aktuell. Om depression eller ångestsyndrom utvecklas gäller rekommendationerna för dessa tillstånd." Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson 2016-10-05 Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 10 av 55 Utmattningssyndrom - F43.8 "För individer med ett uttalat och väldiagnostiserat utmattningssyndrom kan arbetsförmågan vara nedsatt under avsevärd tid. Återhämtning, med hjälp av aktiv specialiserad rehabilitering, och successiv återgång i arbete, tar inte sällan mer än 6 månader och i vissa fall upp till ett år eller längre." 5.3.2 M75 För M75 finns det en gemensam skrivning i det diagnosspecifika försäkringsmedicinska beslutsstödet om de vanligaste besvären. Rekommendationerna varierar något beroende på om patientens arbete är fysiskt tungt eller ej. Skulder- och axelledsbesvär: M75.4, M75.3, M75.0, M75.1, M65.9B "Kalkaxel och impingementsyndrom på dominant sida kan sätta ned arbetsförmågan helt i upp till 2 veckor. I fall med arbete som huvudsakligen görs med armarna ovanför axelhöjd eller arbete med krav på god rörlighet i axlarna kan arbetsförmågan vara begränsad i upp till 3 veckor. I många fall behövs deltidssjukskrivning samt anpassning av arbetsförhållanden i väntan på andra åtgärder. Samma förhållningssätt kan vara lämpligt vid sjukskrivning vid impingementsyndrom och tendinoser där besvären bedöms ha samband med arbetet. Efter operation vid impingementsyndrom på dominant sida kan arbetsförmågan vara nedsatt; vid lätt arbete i upp till 3 veckor, vid medeltungt arbete i upp till 6 veckor och vid tungt arbete i upp till 12 veckor. Ibland kan sjukskrivningstiden kortas vid icke dominant sida. Efter rotatorcuffsutur på dominant sida kan arbetsförmågan vara nedsatt; vid lätt arbete upp till 6 veckor, vid medeltungt arbete i upp till 12 veckor och vid tungt arbete i upp till 26 veckor. Ibland kan sjukskrivningstiden kortas vid icke dominant sida. Efter operation vid frusen skuldra varierar behovet av sjukskrivning beroende på typ av arbete. I ett icke rörelsekrävande arbete kan arbetet återupptas redan efter några dagar medan det i ett tungt arbete med belastning över axelnivå kan behövas upp till någon månads sjukskrivning." Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson 2016-10-05 Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 11 av 55 5.4 Studiepopulationer För båda diagnoserna (F43 och M75) inkluderades samtliga personer som var 18-64 år den 31 december 2011 och som hade minst ett sjukskrivningsfall som uppfyllde följande kriterier: startade under 2011 och varade i mer än 14 dagar (>14 dagar valdes för att inte introducera bias, se ytterligare förklaring ovan) första huvuddiagnosen i sjukskrivningsfallet var F43 respektive M75 första förmånstypen var sjukpenning (detta innebär att de personer som hade rehabiliteringspenning, arbetsskadesjukpenning eller förebyggande sjukpenning vid sjukskrivningsfallets start inte inkluderades.) Detta resulterade i 32 542 personer för F43 och 7 598 personer för M75. Några av dessa hade fler än ett fall som uppfyllde inklusionskriterierna (1 357personer (4,2 %) för F43 och 401 personer (5,3 %) för M75), det kronologiskt första av dessa sjukskrivningsfall valdes inför analyserna. Fokus i SRS projektet är, vid tidpunkten för detta delprojekts genomförande, på allmänläkare i primärvården. Då det inte finns något rikstäckande register över besök i primärvården och det inte framgår av MiDAS från vilken sjukvårdsenhet som sjukintyget har skrivits, använde vi följande kriterier för att i så stor utsträckning som möjligt säkerställa att endast sjukskrivningar som genererats i primärvården inkluderades i analyserna: Information togs fram om vilka sjukskrivna personerna som, enligt patientregistret hade haft besök inom specialiserad öppenvård alternativt varit inlagd på sjukhus i samband med starten av sjukskrivningsfallet. 'I samband med starten' definierades då som från 4 dagar före den första dagen i fallet till och med dag 8 i fallet. För F43 hade 4 254 personer (13,1 %) sådan öppen- eller slutenvård i samband med starten av sitt första fall, för M75 var motsvarande antal 3 085 (40,6 %). De fall som hade öppen- eller slutenvård vid starten ansågs ha fått sitt första sjukintyg utfärdat från ett sjukhus medan övriga ansågs ha fått sitt första sjukintyg utfärdat av läkare inom primärvården. Det innebär att för F43 återstod 28 288 personer som ansågs ha fått sitt läkarintyg utfärdat av läkare inom primärvården och dessa inkluderades således i analyserna. För M75 var motsvarande antal 4 513 personer. Bakgrundsfaktorer för dessa fyra grupper presenteras i Tabell 2 och Tabell 4. 5.5 Variabler 5.5.1 Utfall Först skapades modeller som predicerar specifika orsaker till att ett sjukskrivningsfall avslutas. Ett sjukskrivningsfall kan avslutas på grund av många olika anledningar, den vanligaste anledningen är att personen i fråga återfår arbetsförmåga och återgår i någon typ av aktivitet (vanligen arbete, men det kan också vara studier, arbetslöshet (det vill säga: söka arbete) eller föräldraledighet). Andra anledningar kan vara att personen avlidit, blivit ålderspensionär, övergått till sjuk- eller aktivitetsersättning alternativt emigrerat (Tabell 1). 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 12 av 55 Tabell 1. Olika orsaker till att ett sjukskrivningsfall avslutas, antal och andel personer vars fall avslutades på grund av dessa olika orsaker bland samtliga personer i åldrarna 18-64 som år 2011 hade ett nytt sjukskrivningsfall i diagnoserna F43 (stressrelaterade psykiska diagnoser) respektive i M75 (Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar, uppdelat på var första sjukintyget i fallet utfärdades. F43 Orsak till avslut av fallet M75 Primärvård Sjukhus Primärvård Sjukhus n (%) n (%) n (%) n (%) Samtliga 28288 (100,0) 4254 (100,0) 4513 (100,0) 3085 (100,0) Avled 24 (0,1) 14 (0,3) 1 (0,0) 1 (0,0) Sjukersättning 346 (1,2) 65 (1,5) 55 (1,2) 14 (0,5) Fyllde 65 samma år 116 (0,4) 25 (0,6) 53 (1,2) 24 (0,8) 31 (0,1) 5 (0,1) 4 (0,1) 2 (0,1) 27771 (98,2) 4145 (97,4) 4400 (97,5) 3044 (98,7) Emigrerade Annan orsak Därefter skapades modeller som predicerar längd på sjukskrivningsfallet. Då inkluderades endast de fall som avslutades på grund av "annan orsak", alltså sjukfallet övergick inte till sjuk- eller aktivitetsersättning och personen varken avled, fyllde 65 år eller emigrerade i samband med att fallet avslutades. Utfallsmåttet i dessa modeller är totala antalet dagar, alltså antalet dagar från första dagen i sjukskrivningsfallet (anmälningsdagen) till den sista dagen med ersättning från Försäkringskassan, enligt ovan. I analyserna är de sjukskrivningsfall som översteg 1000 dagar exkluderade, detta innebar att 47 sjukskrivningsfall exkluderades för F43 och att ett sjukskrivningsfall exkluderades i analyserna av M75. 5.5.2 Prediktionsfaktorer i steg 1 i projektet I det första steget i analyserna inkluderades information som allmänläkaren kan antas ha tillgång till inom ramen för SRS projektet. Dit hör patientens kön, ålder, sysselsättningsstatus (yrkesarbetande, arbetslös, studerande eller föräldraledig), sjukskrivningens omfattning i början (100, 75, 50 eller 25 % av ordinarie arbetstid), månad när sjukskrivningen initierades samt om personen då samtidigt hade en pågående partiell sjuk- eller aktivitetsersättning eller inte (Tabell 2). 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 13 av 55 Tabell 2. Bakgrundsfaktorer för samtliga personer i åldrarna 18-64 som år 2011 hade ett nytt sjukskrivningsfall i diagnoserna F43 (stressrelaterade psykiska diagnoser) respektive i M75 (Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar, uppdelat på var första sjukintyget i fallet utfärdades. F43 Samtliga M75 Primärvård Sjukhus Primärvård Sjukhus n (%) n (%) n (%) n (%) 28288 (100,0) 4254 (100,0) 4513 (100,0) 3085 (100,0) Kön Kvinnor 21790 (77,0) 3098 (72,8) 2588 (57,3) 1351 (43,8) Män 6498 (23,0) 1156 (27,2) 1925 (42,7) 1734 (56,2) Åldersgrupper 18-30 år 3093 (10,9) 639 (15,0) 268 (5,9) 81 (2,6) 31-40 år 7113 (25,1) 1245 (29,3) 601 (13,3) 291 (9,4) 41-50 år 8941 (31,6) 1243 (29,2) 1438 (31,9) 923 (29,9) 51-64 år / (51-57 år för M75) 9141 (32,3) 1127 (26,5) 1197 (26,5) 946 (30,7) 1009 (22,4) 844 (27,4) 58-64 år Sysselsättning vid fallets start Anmälan från Arbetsgivare, Personen omfattas av Sjuklön 25652 (90,7) 3627 (85,3) 4068 (90,1) 2716 (88,0) Anställd Dag 1, Personen omfattas ej av Sjuklön 224 (0,8) 55 (1,3) 27 (0,6) 25 (0,8) Egenföretagare 426 (1,5) 86 (2,0) 198 (4,4) 149 (4,8) 98 (0,3) 15 (0,4) 16 (0,4) 20 (0,6) 1610 (5,7) 383 (9,0) 189 (4,2) 166 (5,4) 262 (0,9) 84 (2,0) 15 (0,3) 8 (0,3) 16 (0,1) 4 (0,1) 0 (0,0) 1 (0,0) 1122 (4,0) 107 (2,5) 104 (2,3) 38 (1,2) 50 % 3933 (13,9) 517 (12,2) 566 (12,5) 216 (7,0) 75 % 722 (2,6) 105 (2,5) 106 (2,3) 74 (2,4) 22511 (79,6) 3525 (82,9) 3737 (82,8) 2757 (89,4) Egenföretagare och anställd (kombinatör) Arbetslös Föräldraledig eller Hemmamakeförsäkrad Studerande Omfattning vid start 25 % 100 % Sjuk- eller aktivitetsersättning Ingen 27278 (96,4) 4065 (95,6) 62 (1,4) 56 (1,8) 25 % 381 (1,3) 68 (1,6) 178 (3,9) 121 (3,9) 50 % 578 (2,0) 114 (2,7) 9 (0,2) 15 (0,5) 75 % 51 (0,2) 7 (0,2) 249 (5,5) 192 (6,2) Inom SRS projektet antas även att allmänläkare i primärvården, inom ramen för SRS projektet, kommer att kunna ha tillgång till information om tidigare sjukskrivningar respektive tidigare sjukeller aktivitetsersättning från Försäkringskassan. En frågeställning har då varit hur detaljerad sådan information behöver vara för att kunna göra bra prediktioner i den kliniska vardagen. Därför har analyser gjorts där flera olika mått på detta har använts. Dessa är 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 14 av 55 Antal bruttodagar/år, det vill säga antal dagar personen haft ersättning från Försäkringskassan. Antal nettodagar/år. Nettodagar hanterar om ersättningen varit för hel- eller deltid. Måtten har tagits fram dels för året innan det studerade sjukskrivningsfallet började, dvs för de 365 dagarna innan det datum som fallet påbörjades (År -1) och dels för ytterligare ett år tillbaka i tiden, alltså mellan 730 och 366 dagar innan sjukskrivningsfallet påbörjades (År -2). Även för tidigare sjukskrivningsfall har de 14 första dagarna i varje sjukskrivningsfall exkluderats, för att inte introducera bias. För att i analyserna kunna se om det har betydelse om personen till exempel tidigare varit sjukskriven eller haft sjuk- eller aktivitetsersättning i samma diagnos eller inte, har antalet brutto- och nettodagar beräknats dels totalt och dels uppdelat på olika diagnosgrupper. Följande fem kategorier har då använts för F43: Tidigare sjukskrivning i F43 Tidigare sjukskrivning i alla andra psykiska diagnoser (F00-F99 exkl. F43) Tidigare sjukskrivning i muskuloskeletala diagnoser (M00-M99) Tidigare sjukskrivning i någon av samtliga övriga somatiska diagnoser Uppgift om diagnos saknas (denna kategori slogs i analyserna samman med ”övriga somatiska diagnoser”) Följande kategorier har använts för M75: Tidigare sjukskrivning i M75 Tidigare sjukskrivning i alla andra muskuloskeletala diagnoser (M00-M99 exkl. M75) Tidigare sjukskrivning i psykiska diagnoser (F00-F99) Tidigare sjukskrivning i någon av samtliga övriga somatiska diagnoser Uppgift om diagnos saknas (denna kategori slogs i analyserna samman med ”övriga somatiska diagnoser”) Dessa mått har alltså tagits fram dels för sjukskrivning och dels för sjuk- och aktivitetsersättning, dels för bruttodagar och dels för nettodagar samt dels för första året innan och dels för andra året innan. Detta innebär att 48 olika variabler har skapats och analyserats för varje diagnosgrupp. I analyserna kategoriserades antal brutto- och nettodagar med tidigare sjukskrivning respektive sjukeller aktivitetsersättning enligt följande fyra kategorier (Tabell 3): 0 dagar 0-90 dagar 90-180 dagar >180 dagar Tabell 3. Sjukskrivningshistorik för samtliga personer i åldrarna 18-64 som år 2011 hade ett nytt sjukskrivningsfall i diagnoserna F43 (stressrelaterade psykiska diagnoser) respektive i M75 (Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar, uppdelat på var första sjukintyget i fallet utfärdades. F43 M75 Primärvård Sjukhus Primärvård Sjukhus n (%) n (%) n (%) n (%) 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson Samtliga Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 15 av 55 28288 (100,0) 4254 (100,0) 4513 (100,0) 3085 (100,0) 23076 (81,6) 3257 (76,6) 3271 (72,5) 2290 (74,2) 4298 (15,2) 787 (18,5) 1028 (22,8) 636 (20,6) 90,25-180 dagar 586 (2,1) 136 (3,2) 144 (3,2) 126 (4,1) >180 dagar 328 (1,2) 74 (1,7) 70 (1,6) 33 (1,1) 22550 (79,7) 3216 (75,6) 3223 (71,4) 2289 (74,2) 4279 (15,1) 718 (16,9) 1003 (22,2) 612 (19,8) 90,25-180 dagar 719 (2,5) 149 (3,5) 156 (3,5) 120 (3,9) >180 dagar 740 (2,6) 171 (4,0) 130 (2,9) 64 (2,1) Tidigare nettodagar med sjukskrivning År -1 Inga dagar 0,25-90 dagar År -2 Inga dagar 0,25-90 dagar Tidigare sjuk- eller aktivitetsersättning, nettodagar År -1 Inga dagar 26521 (93,8) 3933 (92,5) 4186 (92,8) 2877 (93,3) 0,25-90 dagar 217 (0,8) 38 (0,9) 179 (4,0) 113 (3,7) 90,25-180 dagar 596 (2,1) 95 (2,2) 106 (2,3) 76 (2,5) >180 dagar 954 (3,4) 188 (4,4) 42 (0,9) 19 (0,6) 26254 (92,8) 3889 (91,4) 4146 (91,9) 2856 (92,6) 0,25-90 dagar 150 (0,5) 37 (0,9) 19 (0,4) 19 (0,6) 90,25-180 dagar 504 (1,8) 89 (2,1) 80 (1,8) 63 (2,0) 1380 (4,9) 239 (5,6) 268 (5,9) 147 (4,8) År -2 Inga dagar >180 dagar I figurerna nedan visas andel personer som hade haft tidigare sjukskrivningsfall som varat i längre än 14 dagar (Figur 1 och Figur 3) samt andel personer som tidigare haft sjuk- eller aktivitetsersättning (Figur 2 och Figur 4). För de fyra studerade grupperna visas detta uppdelat på diagnos för de tidigare sjukskrivningsfallen eller tidigare sjuk- eller aktivitetsersättning samt för första respektive andra året innan. 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration Sidan 16 av 55 Tidigare nettodagar med sjukskrivning - F43 12,0 Andel personer (%) 10,0 8,0 6,0 4,0 2,0 0,0 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 F43 Andra psyk. Musk. diagnoser diagnoser Övriga somatiska diagnoser F43 Primärvård, n=28288 0,25-90 dagar Andra psyk. Musk. diagnoser diagnoser Övriga somatiska diagnoser Sjukhus, n=4254 90,25-180 dagar >180 dagar Figur 1. Andel (%) personer som under första (År -1) respektive andra (År -2) året innan det studerade sjukskrivningsfallet påbörjades haft ett sjukskrivningsfall som varat i mer än 14 dagar, uppdelat på typ av diagnos, bland personer i åldrarna 1864 som år 2011 hade ett nytt sjukskrivningsfall i diagnos F43 (stressrelaterade psykiska diagnoser) respektive i M75 (Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar, uppdelat på var första sjukintyget i fallet utfärdades. Tidigare nettodagar med sjuk- eller aktivitetsersättning - F43 4,0 Andel personer (%) 3,5 3,0 2,5 2,0 1,5 1,0 0,5 0,0 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 F43 Andra psyk. Musk. diagnoser diagnoser Primärvård, n=28288 0,25-90 dagar Övriga somatiska diagnoser F43 90,25-180 dagar Andra psyk. Musk. diagnoser diagnoser Övriga somatiska diagnoser Sjukhus, n=4254 >180 dagar Figur 2. Andel (%) personer som under första (År -1) respektive andra (År -2) året innan det studerade sjukskrivningsfallet påbörjades haft ett sjukskrivningsfall som varat i mer än 14 dagar, uppdelat på typ av diagnos, bland personer i åldrarna 1864 som år 2011 hade ett nytt sjukskrivningsfall i diagnos F43 (stressrelaterade psykiska diagnoser) respektive i M75 (Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar, uppdelat på var första sjukintyget i fallet utfärdades. 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration Sidan 17 av 55 Tidigare nettodagar med sjukskrivning - M75 14,0 Andel personer (%) 12,0 10,0 8,0 6,0 4,0 2,0 0,0 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 M75 Andra musk. Psykiska diagnoser diagnoser Övriga somatiska diagnoser M75 Primärvård, n=4513 0,25-90 dagar Andra musk. Psykiska diagnoser diagnoser Övriga somatiska diagnoser Sjukhus, n=3085 90,25-180 dagar >180 dagar Figur 3. Andel (%) personer som under första (År -1) respektive andra (År -2) året innan det studerade sjukskrivningsfallet påbörjades haft ett sjukskrivningsfall som varat i mer än 14 dagar, uppdelat på typ av diagnos, bland personer i åldrarna 1864 som år 2011 hade ett nytt sjukskrivningsfall i diagnos F43 (stressrelaterade psykiska diagnoser) respektive i M75 (Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar, uppdelat på var första sjukintyget i fallet utfärdades. Tidigare nettodagar med sjuk- eller aktivitetsersättning - M75 4,5 Andel personer (%) 4,0 3,5 3,0 2,5 2,0 1,5 1,0 0,5 0,0 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 M75 Andra musk. Psykiska diagnoser diagnoser Primärvård, n=4512 0,25-90 dagar Övriga somatiska diagnoser M75 90,25-180 dagar Andra musk. Psykiska diagnoser diagnoser Övriga somatiska diagnoser Sjukhus, n=3085 >180 dagar Figur 4. Andel (%) personer som under första (År -1) respektive andra (År -2) året innan det studerade sjukskrivningsfallet påbörjades haft ett sjukskrivningsfall som varat i mer än 14 dagar, uppdelat på typ av diagnos, bland personer i åldrarna 1864 som år 2011 hade ett nytt sjukskrivningsfall i diagnos F43 (stressrelaterade psykiska diagnoser) respektive i M75 (Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar, uppdelat på var första sjukintyget i fallet utfärdades. 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration Sidan 18 av 55 Då det kan tänkas att den månad då sjukskrivningsfallet startade kan ha samband med hur långt fallet blir, inkluderades även denna faktor i steg 1. I Figur 5 presenteras hur stor andel av sjukskrivningsfallen i F43 respektive M75 som påbörjades varje månad, i relation till om sjukskrivningen började inom primärvården eller inom sjukhusvården. 12,0 10,0 8,0 6,0 4,0 2,0 0,0 Sjukhus Primärvård Sjukhus F43, n=35 542 Primärvård M75, n=7 598 Januari Februari Mars April Maj Juni Juli Augusti September Oktober November December Figur 5. Andel (%) personer vars sjukskrivningsfall startade en specifik månad under år 2011 bland personer i åldrarna 18-64 som år 2011 hade ett nytt sjukskrivningsfall i diagnos F43 (stressrelaterade psykiska diagnoser) respektive i M75 (Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar, uppdelat på var första sjukintyget i fallet utfärdades. 5.5.3 Prediktionsfaktorer i steg 2 i projektet I steg 2 har ytterligare variabler lagts till, variabler som finns tillgängliga i IMAS-databasen och som forskargruppen har anledning att tro skulle påverka utfallet, baserat i tidigare studier, litteraturöversikter och diskussioner med praktiker och SRS-projektet. Dessa variabler är: födelseland, typ av boenderegion (H-region), utbildningsnivå, familjesituation, civilstatus, typ av yrke samt arbetssektor (Tabell 4). För 22 personer som var sjukskrivna i diagnos F43 och för en person som var sjukskriven i diagnos M75 saknades information gällande de variabler som presenteras i Tabell 4, dessa personer exkluderades ur analyserna i steg 2. 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 19 av 55 Tabell 4. Bakgrundsfaktorer för samtliga personer i åldrarna 18-64 som år 2011 hade ett nytt sjukskrivningsfall i diagnoserna F43 (stressrelaterade psykiska diagnoser) respektive i M75 (Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar, uppdelat på var första sjukintyget i fallet utfärdades. F43 Samtliga Födelseland Sverige Primärvård Sjukhus Primärvård Sjukhus n (%) n (%) n (%) n (%) 28268 (100,0) 4252 (100,0) 4512 (100,0) 3085 (100,0) 24575 (86,9) 3547 (83,4) 3546 (78,6) 2621 (85,0) Övriga Norden 873 (3,1) 104 (2,4) 233 (5,2) 154 (5,0) Övriga EU25 602 (2,1) 89 (2,1) 98 (2,2) 56 (1,8) 2218 (7,8) 512 (12,0) 635 (14,1) 254 (8,2) 2605 (9,2) 497 (11,7) 1019 (22,6) 600 (19,4) Gymnasium (10-12 år) 12953 (45,8) 2019 (47,5) 2851 (63,2) 1802 (58,4) Eftergymnasial (≥13 år) 12710 (45,0) 1736 (40,8) 642 (14,2) 683 (22,1) 11455 (40,5) 1919 (45,1) 1310 (29,0) 1090 (35,3) Mellanstor stad 9549 (33,8) 1344 (31,6) 1773 (39,3) 1034 (33,5) Småorter 7264 (25,7) 989 (23,3) 1429 (31,7) 961 (31,2) 4016 (14,2) 536 (12,6) 918 (20,3) 730 (23,7) 11945 (42,3) 1664 (39,1) 1697 (37,6) 1255 (40,7) 8218 (29,1) 1411 (33,2) 1358 (30,1) 842 (27,3) 3955 (14,0) 606 (14,3) 518 (11,5) 248 (8,0) 134 (0,5) 35 (0,8) 21 (0,5) 10 (0,3) 15142 (53,6) 2439 (57,4) 2312 (51,2) 1404 (45,5) 13126 (46,4) 1813 (42,6) 2200 (48,8) 1681 (54,5) Sektor Information saknas 1947 (6,9) 442 (10,4) 277 (6,1) 138 (4,5) Offentliga sektorn 12220 (43,2) 1574 (37,0) 1352 (30,0) 874 (28,3) Privata sektorn 14101 (49,9) 2236 (52,6) 2883 (63,9) 2073 (67,2) Yrke1 Saknar yrke 968 (3,4) 207 (4,9) 211 (4,7) 115 (3,7) Tjänsteman 13688 (48,4) 1767 (41,6) 613 (13,6) 879 (28,5) Arbetare 13612 (48,2) 2278 (53,6) 3688 (81,7) 2091 (67,8) Övriga världen Utbildningsnivå Grundskola (≤9 år) H-region Storstad Familjesituation Gift/sambo, utan hemmavarande barn Gift/sambo, med hemmavarande barn Ensamstående, utan hemmavarande barn Ensamstående, med hemmavarande barn Hemmaboende ungdom, <20år Civilstånd Ogift, skild, änka/änkling Gift, registrerat partnerskap 1 M75 Denna kategorisering är baserad på första nivån på SSYK som anger yrkesområde. I gruppen Tjänstemän ingår yrkesområdena ledningsarbete, arbete som kräver teoretisk specialkompetens, arbete som kräver kortare högskoleutbildning samt militärt arbete. I gruppen Arbetare ingår samtliga övriga grupper. 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 20 av 55 Två ytterligare faktorer relaterat till sjukskrivningshistorik inkluderades i steg 2, dessa var att innan den studerade sjukskrivningen ha uppnått maximal tid i sjukförsäkringen samt att tidigare fått sin sjukpenning indragen. Tabell 5. Tidigare uppnådd maxtid i sjukförsäkringen samt tidigare indragen sjukpenning för samtliga personer i åldrarna 1864 som år 2011 hade ett nytt sjukskrivningsfall i diagnoserna F43 (stressrelaterade psykiska diagnoser) respektive i M75 (Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar, uppdelat på var första sjukintyget i fallet utfärdades. F43 Samtliga Tidigare uppnådd maxtid i sjukförsäkringen Tidigare indragen sjukpenning M75 Primärvård Sjukhus Primärvård Sjukhus n (%) n (%) n (%) n (%) 28268 (100,0) 4252 (100,0) 4512 (100,0) 3085 (100,0) 1411 (5,0) 260 (6,1) 153 (3,4) 50 (1,6) 580 (2,1) 132 (3,1) 128 (2,8) 65 (2,1) Även variabler om antal besök i specialiserad öppenvård och antal dagar inom slutenvården (alltså antal dagar med inläggning på ett sjukhus) har inkluderats. Dessa var beräknade dels för första året innan och dels för andra året innan datumet då det studerade sjukskrivningsfallet påbörjades samt dels för alla besök och inläggningar oavsett diagnos och dels uppdelat på olika diagnosgrupper på samma sätt som variablerna om diagnoserna för tidigare sjukskrivning och sjuk- och aktivitetsersättning (se ovan, sidan 14). För slutenvård fanns det diagnoser registrerade för samtliga inläggningar, det vill säga, det var inga i kategorin ”Uppgift om diagnos saknas”. Två typer av ICD koder togs inte med i dessa beräkningar. Dels ”Spontanförlossning vid enkelbörd” (O80), dels Z-koderna (Z00-Z99); "Faktorer av betydelse för hälsotillståndet och för kontakter med hälso- och sjukvården”, det vill säga, besök som inte rör sjukdom eller skada, utan kontakter i samband med screening, utredning etcetera. Vi inkluderade dock en Z-kod, nämligen Z73 – ”Problem som har samband med svårigheter att kontrollera livssituationen”. I analyserna kategoriserades de i detta stycke beskrivna 22 variablerna (per diagnos) baserat på medianen bland dem som hade minst ett besök eller minst en dag med inläggning (Tabell 6): Inga besök respektive inga dagar med inläggning Mellan ett besök respektive en dag med inläggning upp till och med medianen av antalet besök eller dagar med inläggning bland de som hade minst ett besök eller minst en dag med inläggning Mer än medianen bland dem som hade minst ett besök respektive minst en dag med inläggning. Medianen av antalet besök inom specialiserad öppenvård, bland dem som hade minst ett besök, var ett eller två besök, beroende på diagnos för besöket. Även medianen av antalet dagar med inläggning på sjukhus (slutenvård) varierade med diagnosen som orsakade inläggningen. Maximala antalet dagar med inläggning för dem som var sjukskrivna i F43 var 247 dagar under första året innan och 268 dagar under andra året innan. För dem som var sjukskrivna i diagnosen M75 var motsvarande siffror 136 respektive 57 antal dagar. Orsaken till dessa långa inläggningar var mentala diagnoser. 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 21 av 55 Tabell 6. Tidigare specialiserad öppenvård samt slutenvård för samtliga personer i åldrarna 18-64 som år 2011 hade ett nytt sjukskrivningsfall i diagnoserna F43 (stressrelaterade psykiska diagnoser) respektive i M75 (Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar, uppdelat på var första sjukintyget i fallet utfärdades. F43 Samtliga M75 Primärvård Sjukhus Primärvård Sjukhus n (%) n (%) n (%) n (%) 28268 (100,0) 4252 (100,0) 4513 (100,0) 3085 (100,0) År -1 Inga besök 16631 (58,8) 1172 (27,6) 2434 (53,9) 273 (8,8) 1-2 besök 7897 (27,9) 1560 (36,7) 1374 (30,5) 1454 (47,1) >2 besök 3740 (13,2) 1520 (35,7) 704 (15,6) 1358 (44,0) År -2 Inga besök 17118 (60,6) 1934 (45,5) 2565 (56,8) 1422 (46,1) 1-2 besök 7560 (26,7) 1237 (29,1) 1275 (28,3) 1009 (32,7) >2 besök 3590 (12,7) 1081 (25,4) 672 (14,9) 654 (21,2) 26409 (93,4) 3398 (79,9) 4192 (92,9) 2764 (89,6) 1126 (4,0) 514 (12,1) 151 (3,3) 178 (5,8) 733 (2,6) 340 (8,0) 169 (3,7) 143 (4,6) År -2 Inga dagar 26293 (93,0) 3737 (87,9) 4153 (92,0) 2764 (89,6) 1-3 dagar 1097 (3,9) 232 (5,5) 198 (4,4) 185 (6,0) >3 dagar 878 (3,1) 283 (6,7) 161 (3,6) 136 (4,4) Öppenvård Slutenvård År -1 Inga dagar 1-3 dagar (1-2 för M75) >3 dagar (>2 för M75) 5.6 Analysmetoder 5.6.1 Predictive models Predictive models are used in many clinical settings to help physicians and patients make prognoses and decisions about treatments. In public health settings, predictive models represent an essential tool for forecasting into the future for establishing policies and regulations. Over time, much research has focused on developing statistical methods to construct and validate predictive models. The literature available on this topic is vast, and references can be requested of the Unit of Biostatistics at Karolinska Institutet. Developing predictive models require taking a number of steps, which may be simplified into the following main ones: (1) identify the object to predict, (2) identify all possible predictors, (3) develop an prediction algorithm, and (4) validate its performance in terms of sensitivity, specificity, prediction error, or other appropriate measures. The above steps are taken in order to develop the prediction model for the present project. The following sections expand on each step. 5.6.1.1 Identifying the object of prediction Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration Sidan 22 av 55 In a series of meetings with representatives from the SRS project, it was agreed to start with individuals who began a sick-leave spell with a specific diagnosis; F43. In the analyses now conducted, information on all people with a first such sick-leave spell in 2011 due to F43 that lasted for more than 14 days and probably was issued in primary health care by a general practitioner was utilized. The object of prediction was the duration of the spell. More details about the study population, definition of the duration and the collection of the data are described above. The duration of a sick-leave spell is expressed in days and varies between individuals and between different spells for the same individual. In statistical jargon, the duration is a random variable that takes on values on the set of natural numbers (days). The distribution of the spells is much skewed to the right. In some analyses, all spells longer than two years were recorded in the statistical analyses as censored at two years, in others they were excluded. The distribution showed preferred values of spell duration, such as one week, two weeks, one month, six months, and one year. The aim of the predictive model was to estimate the shape of the distribution of duration for each of the different types of individuals. For example, Figur 6 shows two different types of individuals. The proportion of individuals still on sickness absence at any given time point are reported on the y-axis. Ninety percent of type A individuals go out of the spell gradually over a range of several months, while ninety percent of type B individuals go out of it in about one-month time. These intervals are shaded in gray in Figure 1. The prediction for type A individuals is less precise than for type B individuals. Type A individuals Type B individuals 1.0 1.0 Proportion on SA Proportion on SA 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 0.5 0.5 0.0 0.0 0 180 Days on SA 365 0 180 Days on SA 365 Figur 6. Distribution of sick-leave spell duration in two different hypothetical populations of individuals; the shaded intervals indicate the period elapsing between the time 5% and 95% of the individuals were out of the sick-leave spell. 5.6.1.2 Identifying all possible predictors All experts involved agreed on defining a minimal set of predictors that would be readily available to the clinicians, who are the intended users of the predictive models. In addition to the minimal set, a number of other possible predictors were identified that could be made available to the clinicians, if they were shown to improve the prediction substantially. Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson 2016-10-05 Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 23 av 55 5.6.1.3 Developing a prediction algorithm We developed a prediction algorithm in several steps. The object of prediction was the distribution of sick-leave spell duration. We started off by stratifying all individuals into subgroups based on sex and categories of age, current occupational status, and duration of previous sick-leave spells and disability pension. This gave us the opportunity to explore the data. Stratification, however, does not constitute the optimal predictive model. Even with our large sample size, stratifying on many factors leads to small number of observations in any given stratum. In addition, estimating each stratum separately entails estimating a very large number of parameters in the predictive models. Besides, stratifying on numeric variables (e.g., age) may be unjustified. For example, it is reasonable to expect that if age is an important predictor, then the distribution of spell duration would vary across age values smoothly. That is, the distribution in 30-year-olds should not be very different from that in 31-year-olds. Age was introduced as a numeric predictor. Regression splines were utilized to check for non-linearity of its effect. Unlike stratification, this entailed introducing very few regression parameters, yielding much greater efficiency in the estimation of their values. The same was repeated for all numeric predictors in the models. The distribution of spell duration was modeled very flexibly by means of piece-wise exponential models. 5.6.1.4 Validating the predictive model In general, predictive models are developed based on available data. The accuracy of their prediction is often measured by sensitivity, specificity, prediction error, reclassification proportion, or other related measures. However, it is quite simple to construct a predictive model that would accurately predict the outcome on each individual in the dataset. This issue is sometimes referred to as “data over-fitting”. The problem with over-fitting is that the good performance of a predictive model with the observed data may not be replicated when the model is applied to new individuals who were not part of the original dataset used to develop the model. Several statistical methods have been proposed to estimate the possible true performance of predictive models on new individuals. When external data, not used to develop the models, are available, these can be utilized to assess the model’s performance. When external data are not available, then internal validations are performed. These are usually based on resampling techniques, which consist of splitting the available data in training and validation subsets, iteratively many times. While internal validations are the best one can generally do, they suffer from lacking real external data. Sub-setting the available data, results in getting similar copies of the same population, which the study population the sample was taken from. For example, if a predictive model is developed on data from individuals living in Stockholm, there is no guarantee that that model would work well if applied to individuals living in Tokyo, Japan, unless data from Tokyo were made available to validate the model. In our present project we are in the very enviable position that we have data from all Sweden and it is the very population of Sweden the predictive models are meant to be used on. This makes lack of validating data much less of an issue than in other, more common, settings. The only assumption we need to make is that what happened in 2011, the year our here used data covers, is not very different from what might happen today in the years to come. This assumption cannot be verified until new data become available. It would be recommendable to update the predictive model, as more recent data become available. Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson 6 2016-10-05 Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 24 av 55 Resultat Den första fasen i detta delprojekt har varit att ta fram analysdatafiler för de analyser som ska genomföras, det vill säga att besluta om initiala avgränsningar av vad/vilka som ska studeras och av vilka prediktorer som ska läggas in i modellerna, i de olika stegen (steg 1 och steg 2) för de båda studerade diagnoserna samt att genomföra analyser i steg 1. Detta var det som haft störst tidsåtgång. Sedan har analyserna i steg 2 utförts. Nedan presenteras centrala resultat från analyserna. Ytterligare resultat presenteras i de två bilagorna, en bilaga för varje diagnos. Resultat i termer av algoritmer och syntax har levererats till SRS projektet. 6.1 Prediction of SA spell for F43 and M75 diagnoses Aims: To predict the final outcome of a spell To predict the duration of a SA spell that terminates with ”back to work” Example. George is 59, male, he was born in England, has a degree, is married and has two sons. He is currently on sick leave with this and that diagnosis and medical history. What can we say about his future? Will George go back to work? If yes, when? 6.2 A note on prediction 6.2.1 Definition We speak of prediction whenever we try to make a meaningful “guess” about future values of a response variable of interest, y, based on a set of predictors, denoted by x. For example, age and education are good predictors of wages; smoking habits, body mass index, and nutrition can be used to predict cardiovascular disease; wind, humidity, and temperature today can predict future weather, and so on. By studying the association between x and y in a training dataset, we can build a predictive model to be used to predict the value of y at new values of x. 6.2.2 Predictive models To characterize the distribution of y, given x, one could simply compute some summary statistics (e.g., the mean, the median) for homogeneous sub-populations. For example, individuals who are similar to George (same age, sex, socio-economic status, etcetera) could be used to predict what will happen to George. This is very inefficient in practice, as the number of subjects like George may be very small, if not zero. Using a statistical model permits borrowing information from George’s neighbours (e.g., those who have a similar age) at the cost of some structural assumptions. For example, one could use a linear model in which y = a + b*x + e, assuming that the mean value of y is a linear function of x. In most real situations, however, the effect of x is likely to be nonlinear; and the distribution of y is usually skewed and may present outliers. To achieve a sufficient flexibility, we used a form of piecewise constant hazard model with time-varying coefficients, as implemented in the R package pch, version 2.1. (Details in Section 6.3.3.) 6.2.2.1 Use of predictive models Suppose we have data on various risk factors (age, sex, smoking habits, body mass index, diabetes, …) in Sweden in 2016; and we implement a statistical model that predicts the risk of cardiovascular disease. Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson 2016-10-05 Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 25 av 55 Can we use this model to predict the number of cardiovascular events in Sweden in 2017? The answer is yes, assuming that the distribution of the risk factors and their association with the response variable will not change sharply in one year from now. Can we apply the same model to Japan? The answer is maybe, or maybe not. The Japanese population has a very different structure, and a number of unobserved characteristics (e.g., genetic factors) that are likely to modify the association between the known predictors and the response variable. Applying the Swedish model to the Japanese population may yield inaccurate predictions. In the present framework, we are using Swedish data to implement a prediction model to be applied to the same population. This means that our predictions will always be accurate. On the other hand, whether predictions are precise or not (for example, how large is a 90% prediction interval) depends on the strength of the available predictors. When x is strongly associated with y, as in the left figure below (Figur 7), predictions will be narrower; individuals with different values of x will also have quite different predictions. When the association is weaker, as in the middle figure, predictions will be less precise, and all individuals will have roughly the same prediction interval. Note that significance does not imply that prediction is ”good”: for example, the right figure below illustrates a significant linear association between x and y (p-value < 0.001, thanks to a large sample size), but predictions are rather poor. Figur 7. Examples of associations between two variables: x and y. 6.3 Prediction models for F43 and M75 In the rest of the document, we will denote sickness absence by SA and disability pension by DP. The goal was to predict the final outcome of SA (going back to work, death, DP 100%, turning 65, emigrating) and, for those who went back to work, the duration of SA (total days). 6.3.1 Predictors We used two sets of predictors. In a first version of the model (steg 1), we used: Age 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 26 av 55 Sex Occupation (in work/unemployed/student) Month of start of SA Extent of SA at start (part time (25, 50 or 75 %) or full time (100 %)) History of SA an DP (sick-leave history), categorized in different groups Extent of partial DP at the start of SA At a second stage (steg 2), the following additional predictors were included: Birthplace (Sweden, other nordic, other EU25, other world) Living area (big/medium/small city) Education (low/medium/high) Family status (with/without partner and living with or without children) Marital status (married/not married) Sector (public/private) Occupation (white/blue collar) Have previously reached maximum time of possible sick-leave days Previously been denied prolongation of SA benefit History of in- and outpatient visits categorized in different group. Information on “sick-leave history” variables was available for one and for two years before the index spell. The history of SA and DP could be coded in four different ways: (net_by) net days, by diagnosis (net_all) net days, all diagnoses (gross_by) gross days, by diagnosis (gross_all) gross days, all diagnoses Similarly, the history of in/outpatient visits could be classified as by/all. We implemented the model using all different definitions of the “history” variables, and compared the results. Selected plots illustrating the distribution of the available predictors and their association with the duration of SA are reported in Appendix I and II. 6.3.2 Predicting the final outcome of a spell We used a multinomial logistic model, as implemented by the nnet R package. This type of regression is used to model the distribution of a categorical response variable with 3 or more levels. The observed distribution of the outcome variables in F43 is shown in Tabell 7: Tabell 7. The different possible outcomes of a sick-leave spell and their distribution among individuals in ages 18-64 who in 2011 had a new SA-spell in diagnosis F43 (stress-related mental diagnoses), that lasted more than 14 days and for which the first sickness certificate was issued in primary health care. Outcome Other (back to work or other activity) Died at the end of SA DP 100% at the end of SA Turning 65 or older that year Emigrated n 27771 24 346 116 31 % 98.2 0.1 1.2 0.4 0.1 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration Sidan 27 av 55 We implemented various different models, as described in Section 6.3.1: in particular, we first used a reduced set of predictors, and only later we included all the available information; and we tried using different definitions of “sick-leave history”. For example, Tabell 8 shows the performance of the “big” model (steg 2), using different definition of “history”, for F43. Net days were always slightly better predictors than gross days, although the difference in terms of performance was not substantial. The “all” formulation has fewer parameters, which yields a better value of AIC and BIC. However, for the sake of generality, we suggest using the “by” formulation, in which a variable for each diagnostic group is included. The prediction is about 98% accurate with all models (see also figures in Appendix I). Similar results were obtained for M75 and are not reported for brevity. Tabell 8. Measures of the model’s performance for four different models predicting the outcomes in Tabell 7, using the extended set of predictors and applying different “history” variables, for diagnosis F43: number of parameters, maximized log-likelihood, Akaike and Bayesian information criterion (AIC and BIC), and proportion of correct predictions. number of parameters max -log likelihood AIC BIC % correct net by 492 1469 3921 7980 98 gross by 492 1502 3989 8047 98 net all 236 1630 3709 5557 98 gross all 236 1638 3723 5571 98 A prediction from the model (steg 2) using net days by diagnoses for sick-leave history will correspond to the probability distribution for George’s final outcome presented in Tabell 9. Tabell 9. Distribution of predicted outcome of the SA-spell for the fictional individual George. Outcome Died at the end of SA DP 100% at the end of SA Turning 65 or older that year Emigrated Other (back to work or other activity) Chance of outcome (%) 1.4 0.9 0.7 0.0 97.0 6.3.3 Predicting the duration of SA for those who go back to work or other activity We used a piecewise-constant hazard model with time-dependent covariates' effect (R package pch, version 1.2). Briefly, the time line is divided into k breaks, and a different Exponential model is fitted within each sub-interval. The value of k is meant to increase with the sample size: we use k = 20 for F43, where about 20,000 observations were available; and k = 5 for M75, where the sample size was less than 5,000. Model parameters are fitted via maximum likelihood. The advantage of this approach is that the model is flexible enough to always guarantee a good approximation of the data distribution. Also in this case, we first used a reduced set of predictors (steg 1), and later included all the available information (steg 2); and we implemented a different model for each definition of the “history” variables. We can say that the model with more predictors is “42% better” than that with fewer predictors, for F43, based on the ratio between the pseudo R-squared values (Tabell 10); and “65% better” for M75. 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration Sidan 28 av 55 The following table illustrates the pseudo R-squared of the model with fewer predictors and that of the richer model, in F43 and M75. Tabell 10. Pseudo R-squared values for the models with fewer predictors (steg 1) and the models with more predictors (steg 2), for both F43 and M75. Diagnosis F43 M75 R2 steg 1 0.017 0.013 R2 steg 2 0.024 0.021 Ratio steg 2/steg 1 1.42 1.65 To compare the performance of different “sick-leave history” variables, we used likelihood criteria (Tabell 11). The differences were negligible, which did not allow us to endorse one specific model. We believe that the “net_by” formulation is quite general and can be applied to all diagnoses. Only results for F43 are presented in the table, similar results were obtained for M75 but are not reported here. Tabell 11. Measures of the models performance for four different models predicting the duration of the SA spell, using the extended set of predictors and applying different “history” variables, for diagnosis F43: number of parameters, maximized log-likelihood, Akaike and Bayesian information criterion (AIC and BIC), number of parameters max -log likelihood AIC BIC net by 2420 150974 306783 326671 gross by 2420 150987 306806 326686 net all 1140 151744 305644 314514 gross all 1140 151733 305623 314493 We used pseudo R-squared and likelihood criteria to rank the predictors based on their importance. In Tabell 12 and in Tabell 13 these measures are presented for the top 10 variables for each of the two diagnoses. We report the number of parameters associated with each predictor (df), the log-likelihood loss when the predictor is removed, the p-value of the corresponding likelihood ratio test, and the pseudo partial R-squared (R2, multiplied by 100) associated with the predictor. It can be seen that in both diagnoses, the most relevant variable was the month at which the SA started. The history of SA and DP due to the same diagnoses was always more important than that for other diagnoses. Also the type of employment was relevant for both diagnoses. For F43 (which refers to stress-related mental diagnoses), an important variable was represented by the family status; while for M75 (shoulder disorders), the age was a fundamental predictor. Tabell 12. The ten most important predictive factors in the model for duration of the SA spell due to diagnosis F43, using the extended set of predictors (steg 2) and applying net days by diagnoses of sick-leave history. SA month Sector SA extent at start Occupation Family status DP extent at start Previously reached MaxTime degrees of freedom (df) 220 40 20 60 78 20 20 log-likelihood loss 393 165 149 100 104 80 68 p-value 100*R2 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.26 0.11 0.10 0.07 0.07 0.05 0.05 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson SA F43 -1 year net SA F43 -2 year net DP Musc -1 year net Version 1.00 Bilaga 5 Prediktionsmodeller, duration 60 60 60 80 63 54 Sidan 29 av 55 0.000 0.000 0.000 0.05 0.04 0.04 Tabell 13. The ten most important predictive factors in the model for duration of the SA spell due to diagnosis M75, using the extended set of predictors (steg 2) and applying net days by diagnoses of sick-leave history. SA month Visits M75 -1 year Age DP Mental -1 year net Occupation Birth country Previously reached MaxTime SA Other -1 year net SA M75 -2 year net SA Mental -1 year net degrees of freedom (df) 55 10 5 15 10 15 5 15 15 15 log-likelihood loss 50 37 16 15 36 15 15 15 14 12 p-value 100*R2 0.000 0.000 0.000 0.015 0.000 0.016 0.000 0.022 0.027 0.055 0.20 0.15 0.06 0.06 0.14 0.06 0.06 0.06 0.05 0.05 6.4 Prediction tools We implemented an R function that generates predictions from the fitted model. The prediction can be from day 0, or from any day after the SA spell started. Users can choose the quantiles to predict (default at quartiles), the coverage of prediction intervals (default: 90, 80, and 50%), and the time points for which to compute the probability to go back to work or to other activity. Below, we present an example by predicting George’s outcome (Tabell 14). And below we illustrate the predictions for another individual than George with a curve (Figur 8). The quantiles show that there is a 25% chance that George's SA spell will be 24 days or shorter, 50% chance that it will be 38 days or shorter and 75% chance that it will be 84 days or shorter. The predicted intervals indicate that there is a 90% chance that his SA spell will become between 17 and 266 days long, and there is a 50% chance that it will be 24 to 84 days long. There is a risk of 63% that his spell will be longer than 30 days, 12% risk that it will be longer than 6 months and 1% risk that it will become longer than two years. All these predictions are valid if George´s spell doesn't end due to any of the four reasons stated at the bottom in Tabell 14. There is also unfortunately a 1.4% risk that George's spell will end due to his death. Tabell 14. Predictions from day 0 for the individual George. Predicted quantiles 1st quartile median 3rd quartile Duration of SA; days 24 38 84 Prediction intervals 90% 80% 50% Duration of SA; range 17 – 266 days 19 – 200 days 24 – 84 days Probabilities days P(Duration of SA > days) % Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson 2016-10-05 Version 1.00 Bilaga 5 Prediktionsmodeller, duration 30 60 90 180 365 730 63 33 24 12 3 1 Predicted reason for end of SA Died at the end of SA DP 100% at the end of SA Turning 65 or older that year Emigrated % 1.4 0.9 0.7 0.0 Sidan 30 av 55 Figur 8. Survival function for another individual then George, for each time in years the curve represents the probability that George's SA spell will become longer than that (e.g. P(SA>6 months)=20%). To assess the quality of the predictions, we generated 90% prediction intervals for all individuals used to fit the models, and computed the intervals widths. The narrowest intervals correspond to more precise predictions. The distribution of the intervals’ width for both F43 and M75 is represented below (Figur 9), using all predictors (steg 2), and defining SA history as “net_by”. For F43 there are quite a lot of individuals with wide 90% prediction intervals, this indicates that even if the model is very accurate (korrekta) it is not very precise (exakta). Predictions for M75 are generally narrower; note, however, that some prediction intervals are very long for both diagnoses. There are small subgroups in which prediction is very precise, yielding a narrow prediction interval. Stöd för rätt sjukskrivning Dnr SKL: 14/3621 2016-10-05 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson F43 Bilaga 5 Prediktionsmodeller, duration Sidan 31 av 55 M75 Figur 9. Histogram of the width of 90 % prediction intervals based on the fitted models (steg 2 and "net_by") for all individuals used to fit the models (i. e. individual's first sickness certificate issued in primary health care and SA spell ended due to "other cause or back to work"). To improve prediction, additional covariates (e.g., medications) could be added to the model. Note that the performance of the prediction model may be very different for other diagnoses. In particular, there may be diagnoses for which prediction is rather simple, and others for which the available information is not enough to formulate a precise model. 7 Concluding remarks The implemented model is very flexible and general. This means that it could be applied, almost with no supervision, to any other diagnosis, which would allow a sort of “industrial production” of predictive models. The main issue is represented by the availability of predictors, on one hand; and by their ability to generate a sufficiently narrow prediction. We did not perform an internal cross-validation of the predictive models because of the following reasons: (1) the sets of predictors in the two predictive models listed in section 6.3.1 were selected based on a-priori knowledge and practical relevance, not on statistical significance of their coefficients or goodness-of-fit measures; (2) all the predictors were introduced as linear covariates and no further modeling was attempted; and (3) as described in section 5.6.1.4, the predictive models were based on data from all of Sweden, which was the very population the predictive models are meant to be used on. Different diagnoses are expected to have a different response in terms of SA, and very different predictors. For example, the duration of SA associated with a fracture may strongly depend on age, while the clinical history may be a more relevant predictor for a psychiatric disorder. Ideally, a different prediction model should be implemented for each diagnostic group. Considering two or more similar diagnoses as members of the same "group" permits increasing the sample size and the statistical power. However, it may generate inaccurate predictions if the members of the diagnostic group are not homogeneous. Another option is to consider broad diagnostic groups, and use the type of diagnosis as an additional predictor. For example, we could implement a single model for different types of fracture, and include the type of fracture as a covariate. This may result in a more 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 32 av 55 parsimonious and efficient model, especially if the effect of other predictors (age, sex, etc) can be assumed to be the same across all types of fracture. The diagnostic groups can be defined in different ways. There are not strong requirement for how the data should be prepared. In principle, a different set of predictors could be used for each diagnostic group. However, in order to formulate a general template, we expect the data to have a standard format. To be processed by our estimating function, the data should include: - the duration of SA (e.g., days in terms of net or gross days) - all (and preferably only) the predictors to be used: age, sex, history of SA and DP, education, occupation, etc. Finally, we emphasize that the outcome of a prediction model can also be used to suggest actions to take in order to reduce the duration of SA. For example, if a specific condition is known to be a relevant risk factor, interventions may be planned to provide support to individuals with that condition. We believe that these data are a great source of information. Future research should be planned to make the best use of it. R packages that were used for the analyses: nnet: Feed-Forward Neural Networks and Multinomial Log-Linear Models, version 7.3-12 (7) pch: Piecewise Constant Hazards Models for Censored and Truncated Data, version 1.2 (8). 8 Diskussion Resultat av projektet, i form av algoritmer och koder för prediktionsmodeller, är möjligt att börja använda direkt. Framtagande av motsvarande modeller för andra diagnoser behövs också och resultaten vad avser prediktionsförmågan varierar troligen mycket med diagnos. De här genomförda analyserna skulle naturligtvis kunnat göras annorlunda, till exempel vad avser inkluderingar och exkluderingar av personer och sjukskrivningsfall samt vad gäller såväl val av variabler som kategorisering av de olika variablerna. Möjligen skulle andra val kunna leda till andra prediktioner. Ytterligare analyser behövs för fördjupad förståelse av dessa mycket komplexa fenomen, som underlag för att kunna genomföra såväl primärpreventiva som rehabiliterande åtgärder. Framförallt är det centralt, för hälso- och sjukvårdens hantering av patienter, att även genomföra analyser av faktorer som predicerar att en patient överhuvudtaget blir sjukskriven bland alla patienter med olika diagnoser, det vill säga, inte enbart genomföra analyser av de som redan är sjukskrivna. Eftersom datamaterialet som dessa modeller baseras på täcker hela Sveriges befolkning i åldrarna 1664 år och det har inte skett några stora förändringar i försäkringssystemet sedan 2011 så är prediktioner som baseras på de framtagna modellerna relativt korrekta. Men de är, speciellt för diagnos F43, inte särskilt exakta. Särskilt när det gäller F43 bör det beaktas att flera olika diagnoser ingår i denna kategori, diagnoser med mycket olika förväntat sjukskrivningsduration. Intervallen på predicerad sjukskrivningsduration är relativt breda för de flesta personer. Det kan bero på flera saker, bland annat att det finns faktorer som påverkar sjukskrivningsdurationen som vi inte har (kunnat) inkludera i dessa modeller eller att durationen till stor del beror på slumpen. 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Sidan 33 av 55 Appendix I – Selected figures F43 4000 6000 8000 days of SA 2000 > 2y 0 Frequency 9 Bilaga 5 Prediktionsmodeller, duration 0 200 400 days of SA Histogram of day of SA 600 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration sex 4000 Histogram of age Sidan 34 av 55 3000 F work 2000 p.leave 1000 unemp. 0 M 20 30 40 age 50 60 Distribution of age, sex, and occupation (16 students omitted) [18,35] (35,50] (50,66] 1000 800 0 200 400 600 800 600 400 200 0 0 200 400 600 800 1000 sex 1000 age F M p.leave Boxplot of days of SA, by age, sex, and occupation stud unemp. work 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration living area 0 0 2000 5000 4000 10000 6000 15000 8000 20000 10000 place of birth Sidan 35 av 55 SW Other N EU25_excl_N World big city 600 400 days of SA 0 200 400 200 0 days of SA village living area 600 place of birth medium SW Other N EU25_excl_N World big city Top: distribution of birth place and living area. Bottom: boxplot of days of SA. medium village 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration education 400 0 0 2000 200 4000 6000 days of SA 8000 10000 600 12000 education Sidan 36 av 55 Low Medium High Low Left: distribution of education level. Right: boxplot of days of SA, by education level. Medium High 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration marital status 0 0 2000 2000 4000 4000 6000 6000 8000 8000 10000 12000 10000 14000 family status Sidan 37 av 55 partner partner+ single single+ Living with child Not married Married < 20 years old 400 days of SA 0 200 400 200 0 days of SA 600 marital status 600 family status partner partner+ single single+ Living with child < 20 years old Not married Married Top: distribution of family and marital status. The symbol “+” indicates the presence of children. Bottom: boxplot of days of SA, by family and marital status. 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration occupation 0 0 2000 2000 4000 4000 6000 6000 8000 8000 10000 10000 12000 12000 sector none public private none wh/coll blue/coll 400 200 0 0 200 400 days of SA 600 occupation 600 sector days of SA Sidan 38 av 55 none public private none Top: distribution of sector/occupation status. Bottom: boxplot of days of SA. wh/coll blue/coll 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration Sidan 39 av 55 month 400 0 0 500 200 1000 1500 days of SA 2000 600 2500 SA start (month) 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 Left: distribution of month at which SA started. Right: boxplot of days of SA, by month. 800 600 0 200 400 days of SA 600 400 200 0 days of SA 800 1000 extent of SA at start 1000 extent of DP at start 0 0.25 0.5 0.75 0.25 0.5 Boxplot of days of SA, by extent of DP and SA at start. 0.75 1 12 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration 800 600 days of SA 0 200 400 600 400 0 200 days of SA 800 1000 net SA Musc year -1 1000 net SA F43 year -1 0 0-90 90-180 >180 0 0-90 90-180 >180 800 600 days of SA 0 200 400 0 200 400 600 800 1000 net SA Other year -1 1000 net SA Other Mental year -1 days of SA Sidan 40 av 55 0 0-90 90-180 >180 0 0-90 90-180 >180 Boxplot of days of SA, by net days of SA in the year before, by cause (F43, muscular, other mental, other). 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration 800 600 days of SA 0 200 400 600 400 0 200 days of SA 800 1000 net SA Musc year -2 1000 net SA F43 year -2 0 0-90 90-180 >180 0 0-90 90-180 >180 800 600 days of SA 0 200 400 0 200 400 600 800 1000 net SA Other year -2 1000 net SA Other Mental year -2 days of SA Sidan 41 av 55 0 0-90 90-180 >180 0 0-90 90-180 >180 Boxplot of days of SA, by net days of SA two years before, by cause (F43, muscular, other mental, other). 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration 800 600 days of SA 0 200 400 600 400 0 200 days of SA 800 1000 net DP Musc year -1 1000 net DP F43 year -1 0 0-90 90-180 >180 0 0-90 90-180 >180 800 600 days of SA 0 200 400 0 200 400 600 800 1000 net DP Other year -1 1000 net DP Other Mental year -1 days of SA Sidan 42 av 55 0 0-90 90-180 >180 0 0-90 90-180 >180 Boxplot of days of SA, by net days of DP in the year before, by cause (F43, muscular, other mental, other). 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration 800 600 days of SA 0 200 400 600 400 0 200 days of SA 800 1000 net DP Musc year -2 1000 net DP F43 year -2 0 0-90 90-180 >180 0 0-90 90-180 >180 800 600 days of SA 0 200 400 0 200 400 600 800 1000 net DP Other year -2 1000 net DP Other Mental year -2 days of SA Sidan 43 av 55 0 0-90 90-180 >180 0 0-90 90-180 >180 Boxplot of days of SA, by net days of DP two years before, by cause (F43, muscular, other mental, other). 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration Sidan 44 av 55 days of SA (simulated) 4000 Frequency 4000 Frequency 6000 6000 8000 8000 days of SA (true) > 2y 0 0 2000 2000 > 2y 0 200 400 pmin(days, 731) 600 0 200 400 600 pmin(s, 731) True (left) vs fitted (right) distribution of the duration of SA. The histogram on the right is obtained by generating random numbers from the fitted model.1 1 The left histogram comes from the real data. The right one is made from simulated data, which means that if I repeat the simulation is repeated, slightly different results will be generated. The figure aims to illustrate how close the fitted model is to the true distribution, and not to assess the "numerical difference" between the true distribution and the fitted one. 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration Sidan 45 av 55 10 Appendix II – selected figures M75 500 > 2y 0 Frequency 1000 1500 days of SA 0 200 400 days of SA Histogram of the number of SA days 600 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration Histogram of age Sidan 46 av 55 sex 600 800 F 400 unemp. p.leave 200 work 0 M 20 30 40 age 50 60 [18,35] (35,50] (50,66] 1000 800 0 200 400 600 800 600 400 200 0 0 200 400 600 800 1000 sex 1000 age F M Top: distribution of age, sex, and occupation. Bottom: boxplot of days of SA. p.leave unemp. work 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration Sidan 47 av 55 month 400 0 0 100 200 200 days of SA 300 600 400 SA start (month) 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 Left: distribution of the month on which SA starts. Right: boxplot of the SA days, by month. 800 600 0 200 400 days of SA 600 400 200 0 days of SA 800 1000 extent of SA at start 1000 extent of DP at start 0 0.25 0.5 0.75 0.25 0.5 0.75 1 Boxplot of SA days, by extent of DP (left) and SA (right) at start. 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration marital status 0 0 500 500 1000 1000 1500 2000 1500 family status Sidan 48 av 55 partner partner+ single single+ Not married 400 days of SA 0 200 400 0 200 days of SA 600 marital status 600 family status Married partner partner+ single single+ Living with child < 20 years old Not married Married Top: _distribution of family status. Bottom: boxplot of days of SA, by family status. The symbol “+” indicates presence of children. 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration education 400 0 0 500 200 1000 1500 days of SA 2000 600 2500 education Sidan 49 av 55 Low Medium High Low Left: distribution of education. Right: boxplot of SA days, by education. Medium High 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration living area 0 0 500 500 1000 1500 2000 1000 2500 3000 1500 3500 place of birth Sidan 50 av 55 SW Other N EU25_excl_N World big city 600 400 days of SA 0 200 400 200 0 days of SA village living area 600 place of birth medium SW Other N EU25_excl_N World big city medium village Top: distribution of birthplace and living area. Bottom: boxplot of SA days, by birthplace and living area. 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration 3000 4000 >180 0 90-180 >180 0 0-90 90-180 >180 90-180 >180 1000 800 800 days of SA 600 0 200 days of SA 0 200 400 800 600 400 200 0 0 0-90 net SA Other year -1 1000 net SA Mental year -1 1000 net SA M75 year -1 0-90 600 90-180 400 0-90 0 0 1000 1000 2000 2000 3000 3000 2000 1000 0 0 days of SA net SA Other year -1 4000 net SA Mental year -1 4000 net SA M75 year -1 Sidan 51 av 55 0 0-90 90-180 >180 0 0-90 90-180 Top: distribution of net days of SA in the year before, by cause (M75, mental, other) Bottom: boxplot of SA days. >180 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration 3000 4000 >180 0 90-180 >180 0 0-90 90-180 >180 90-180 >180 1000 800 800 days of SA 600 0 200 days of SA 0 200 400 800 600 400 200 0 0 0-90 net SA Other year -2 1000 net SA Mental year -2 1000 net SA M75 year -2 0-90 600 90-180 400 0-90 0 0 1000 1000 2000 2000 3000 3000 2000 1000 0 0 days of SA net SA Other year -2 4000 net SA Mental year -2 4000 net SA M75 year -2 Sidan 52 av 55 0 0-90 90-180 >180 0 0-90 90-180 Top: distribution of net days of SA two years before, by cause (M75, mental, other) Bottom: boxplot of SA days. >180 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration net DP Mental year -1 3000 4000 0 >180 0 90-180 >180 0 0-90 90-180 >180 90-180 >180 1000 800 800 days of SA 600 0 200 days of SA 0 200 400 800 600 400 200 0 0 0-90 net DP Other year -1 1000 net DP Mental year -1 1000 net DP M75 year -1 0-90 600 90-180 400 0-90 0 1000 1000 2000 2000 3000 4000 3000 2000 1000 0 0 days of SA net DP Other year -1 4000 net DP M75 year -1 Sidan 53 av 55 0 0-90 90-180 >180 0 0-90 90-180 Top: distribution of net days of DP in the year before, by cause (M75, mental, other) Bottom: boxplot of SA days. >180 2016-10-05 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Version 1.00 Alexanderson, Bottai, Frumento, Hinas, Nilsson Bilaga 5 Prediktionsmodeller, duration net DP Mental year -2 3000 4000 0 >180 0 90-180 >180 0 0-90 90-180 >180 90-180 >180 1000 800 800 days of SA 600 0 200 days of SA 0 200 400 800 600 400 200 0 0 0-90 net DP Other year -2 1000 net DP Mental year -2 1000 net DP M75 year -2 0-90 600 90-180 400 0-90 0 1000 1000 2000 2000 3000 4000 3000 2000 1000 0 0 days of SA net DP Other year -2 4000 net DP M75 year -2 Sidan 54 av 55 0 0-90 90-180 >180 0 0-90 90-180 Top: distribution of net days of DP two years before, by cause (M75, mental, other) Bottom: boxplot of SA days. >180 Stöd för rätt sjukskrivning Dnr SKL: 14/3621 Alexanderson, Bottai, Frumento, Hinas, Nilsson 2016-10-05 Version 1.00 Bilaga 5 Prediktionsmodeller, duration Sidan 55 av 55 11 Referenser, i urval 1. International Statistical Classification of Diseases and Related Health Problems 10th Revision, Version for 2007: WHO; 2010 [cited 2010 March 26]. http://www.who.int/classifications/icd/en/]. 2. Alexanderson K, Bottai M, Frumento P, Hinas E, Nilsson K, Kjeldgård L, Tinghög P. Prediktion av fortsatt sjukskrivning respektive av långtidssjukskrivning bland sjukskrivna personer. Försäkringskassan och Sverige Kommuner och Landsting (SKL), 2016. 3. Hinas E, Nilsson K, Tinghög P, Mittendorfer-Rutz E, Alexanderson K. Prediktion av fortsatt sjukfrånvaro bland personer sjukskrivna i depressiv episod respektive i artros (Bilaga 5, Förstudierapport Stöd för rätt sjukskrivning; SRS). Försäkringskassan och Sverige Kommuner och Landsting (SKL), 2015. 4. MiDAS Sjukpenning och rehabiliteringspenning. Försäkringskassan, 2011. 5. Longitudinell Integrationsdatabas för Sjukförsäkrings- och Arbetmsmarknadsstudier (LISA) 1990 till 2009. SCB, 2011. 6. Försäkringsmedicinskt beslutsstöd - vägledning för sjukskrivning (reviderad 2012). Stockholm: Socialstyrelsen; 2012. 7. Venables W, Ripley B. Modern Applied Statistics with S. 4th ed. NY: Springer; 2002. 8. Frumento P. pch: Piecewise Constant Hazards Models for Censored and Truncated Data.: R package version 1.2, url: http://CRAN.Rproject.org/package=pch; 2016.
© Copyright 2024