Bilaga 5 Prediktionsmodeller för sjukskrivningsduration

Stöd för rätt sjukskrivning
– ett samverkansprojekt mellan Försäkringskassan
och Sveriges Kommuner och Landsting
Bilaga 5
Stöd för rätt sjukskrivning 2016
Prediktionsmodeller för
sjukskrivningsduration
Kristina Alexanderson
Matteo Bottai
Paolo Frumento
Elin Hinas
Kerstin Nilsson
Enheten för biostatistik samt Sektionen för försäkringsmedicin
Karolinska Institutet
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
2016-10-05
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
Sidan 2 av 55
Innehållsförteckning
1
Inledning ......................................................................................................................................... 3
2
Sammanfattning .............................................................................................................................. 3
3
I rapporten används följande förkortningar och begrepp ................................................................ 6
4
Inledning ......................................................................................................................................... 7
4.1
5
Syfte ........................................................................................................................................ 7
Material och metod ......................................................................................................................... 7
5.1
Data ......................................................................................................................................... 7
5.1.1
5.2
Två diagnoser; F43 och M75 ................................................................................................... 9
5.3
Socialstyrelsens försäkringsmedicinska beslutsstöd ............................................................... 9
5.3.1
F43 ................................................................................................................................... 9
5.3.2
M75 ............................................................................................................................... 10
5.4
Studiepopulationer................................................................................................................. 11
5.5
Variabler ................................................................................................................................ 11
5.5.1
Utfall.............................................................................................................................. 11
5.5.2
Prediktionsfaktorer i steg 1 i projektet .......................................................................... 12
5.5.3
Prediktionsfaktorer i steg 2 i projektet .......................................................................... 18
5.6
Analysmetoder....................................................................................................................... 21
5.6.1
6
Information i MiDAS ...................................................................................................... 8
Predictive models .......................................................................................................... 21
Resultat ......................................................................................................................................... 24
6.1
Prediction of SA spell for F43 and M75 diagnoses ............................................................... 24
6.2
A note on prediction .............................................................................................................. 24
6.2.1
Definition....................................................................................................................... 24
6.2.2
Predictive models .......................................................................................................... 24
6.3
Prediction models for F43 and M75 ...................................................................................... 25
6.3.1
Predictors ....................................................................................................................... 25
6.3.2
Predicting the final outcome of a spell .......................................................................... 26
6.3.3
Predicting the duration of SA for those who go back to work or other activity ............ 27
6.4
Prediction tools ...................................................................................................................... 29
7
Concluding remarks ...................................................................................................................... 31
8
Diskussion .................................................................................................................................... 32
9
Appendix I – Selected figures F43 ............................................................................................... 33
10
Appendix II – selected figures M75 ............................................................................................. 45
11
Referenser, i urval......................................................................................................................... 55
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
1
2016-10-05
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 3 av 55
Inledning
Försäkringskassans prognoser visar att sjukskrivningarna ökar både i omfattning och i längd.
Sjukskrivning är en viktig del av vård och behandling, men forskning visar också att långvariga
sjukskrivningar kan leda till sämre hälsa, ekonomi och relationer.
Idén bakom projektet Stöd för rätt sjukskrivning, SRS, är att förbättra för alla inblandade i
sjukskrivnings- och rehabiliteringsprocessen, inklusive individen själv. Ett gemensamt IT-baserat
bedömningsstöd kan bidra med ett samlat kunskapsunderlag för att läkare ska kunna utfärda
läkarintyg med större träffsäkerhet samt hjälpa hälso- och sjukvården att identifiera individer som
har behov av specifika eller samordnade insatser. I framtiden kan bedömningsstödet också
användas som ett stöd för arbetsgivare och av individen själv för att kunna ta en aktiv del i sin
egen rehabilitering.
Förutsättningarna för att skapa ett bedömningsstöd utreddes i en förstudie 2014-2015. Då
undersöktes bland annat vilken kunskap som fanns i forskningen om prognosfaktorer som
påverkar sjukskrivningen, eftersom sådan kunskap kan ge mer träffsäkra prediktioner om
sjukskrivningslängd och omfattning för en enskild individ. Under 2016 har projektet genomfört
ytterligare utredningsarbete inom tre områden:



Juridiska utredningar - förslag om ansvar och roller för bedömningsstödet,
personuppgiftsansvar, ansvar för utveckling, drift och förvaltning samt ansvar för
utveckling och förfining av bedömningsstödets prediktionsmodeller.
Kostnads- och nyttoanalys - identifiera och jämföra kostnader med nyttor ur både ett kortoch långsiktigt samhällsekonomiskt perspektiv för ett bedömningsstöd infört i hälso- och
sjukvården.
Verksamhetsanalys – användarbehov och prototyptester, etisk analys, utredning om
rehabiliteringsinsatser och insatsförteckning, fördjupad utredning om prediktiva modeller.
Projektet har finansierats via Socialdepartementet genom överenskommelsen mellan regeringen
och Sveriges Kommuner och Landsting, SKL, om en kvalitetssäker och effektiv sjukskrivningsoch rehabiliteringsprocess. SKL har ansvarat för projektet och har tillsammans med
Försäkringskassan utgjort projektets styrgrupp. Utredningsarbetet påbörjades i januari 2016 och
slutredovisning sker till socialdepartementet i oktober 2016.
Utredningsarbetet har utförts av en arbetsgrupp med bred kompetens och med stor samlad
erfarenhet av nationella e-hälsoprojekt. Delar av utredningsarbetet har utförts av och med forskare
och utredare från Karolinska Institutet.
Denna rapport redovisar endast en del av projektets arbete. Hela rapporten med en
sammanfattning av resultatet går att beställa av [email protected].
Mer information om projektet Stöd för rätt sjukskrivning finns på SKL:s webbplats:
http://skl.se/halsasjukvard/sjukskrivningochrehabilitering/sjukskrivningsmiljarden/rattsjukskrivningsto
d.5229.html
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
2
2016-10-05
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 4 av 55
Sammanfattning
I detta delprojekt, inom det övergripande SRS projektet, har data från sex rikstäckande register från tre
myndigheter (Försäkringskassan, Socialstyrelsen och Statistiska centralbyrån) använts i analyser för
att ta fram modeller för prediktion av längd av påbörjade sjukskrivningsfall. Uppdraget var att göra
detta i två steg och för två olika diagnoser. Det första steget var att ta fram en modell innehållande de
faktorer som en allmänläkare bedömdes kunna ha tillgång till, inom ramen för ett utökat SRS projekt, i
mötet med patienten. Det andra steget var att ta fram en prediktionsmodell där ytterligare faktorer
inkluderades, faktorer som i tidigare studier visats vara av betydelse för sjukskrivningsduration.
De två studerade diagnoserna var "anpassningsstörningar och reaktion på svår stress" (F43) samt
"sjukdomstillstånd i skulderled" (M75), det vill säga, dels en psykisk diagnos med ett mycket stort och
ökande antal långa sjukskrivningar, dels en muskuloskeletal diagnos, även den med många
sjukskrivningar. Samtliga personer i åldrarna 16-64 med ett nytt sådant sjukskrivningsfall som
påbörjades under 2011 och som blev mer än 14 dagar långt inkluderades. Eftersom fokus skulle vara
på sjukskrivningar där det första sjukintyget utfärdats av läkare inom primärvården exkluderades de
personer som vid sjukskrivningens start var inlagda på sjukhus eller hade träffat en läkare på en
specialiserad öppenvårdsklinik. För diagnosen F43 inkluderades drygt 28 000 personer och för M75
cirka 4 500 personer.
I steg 1användes information om följande variabler: kön, ålder, månad sjukskrivningen påbörjades,
sysselsättning, hel- eller deltidssjukskrivning i början av fallet, om personen samtidigt hade deltids
sjuk- eller aktivitetsersättning samt tidigare sjukskrivningar respektive tidigare sjuk-eller
aktivitetsersättning under ett år före respektive under två år före datum för det nya fallets start,
generellt och i olika diagnoser.
I steg 2 inkluderades såväl dessa som ytterligare variabler. De nya var: utbildningsnivå, födelseland,
typ av boendekommun, familjesituation, civilstånd, typ av sektor personen arbetade inom samt typ av
yrke, tidigare uppnått maxtid inom försäkringen respektive att tidigare ha fått sjukpenningen indragen.
När det gäller tidigare sjukvård användes dessa variabler, dels för ett år före, dels för två år före datum
för att det studerade fallet påbörjades: antal besök i specialiserad öppenvård, generellt och per
diagnosgrupp, antal och duration av sjukhusinläggningar, generellt och per diagnosgrupp.
Avancerade prediktionsmodeller användes för analyserna. Först skapades prediktionsmodeller där
orsak till avslut av sjukskrivningsfallet predicerades. Därefter skapades modeller som predicerar längd
på sjukskrivningsfallet endast för de fall som inte avslutades på grund av att sjukskrivningsfallet
övergick till sjuk- eller aktivitetsersättning eller genom att personen avled, fyllde 65 år eller
emigrerade.
De framtagna prediktionsmodellerna gav ett korrekt resultat av prediktionerna för båda diagnoserna.
Däremot var prediktionen svagare och hög precision fanns endast för vissa grupper. Orsaker till det
kan vara flera, bland annat att båda diagnoserna innehåller ett flertal olika underdiagnoser, med
förväntad stor skillnad i sjukskrivningsduration. De mest relevanta variablerna var
sjukskrivningsmånad, sjukskrivningsgrad och tidigare sjukskrivning eller sjuk- eller
aktivitetsersättning i samma diagnos. Användande av nettodagar istället för bruttodagar samt att
inkludera information om diagnosspecifik tidigare sjukfrånvaro och vård, förbättrade
prediktionsvärdet med 50-80 %. Ålder hade ett prediktionsvärde för diagnosen M75 men inte för F43.
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
2016-10-05
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 5 av 55
Prediktionsmodellen för estimering av sjukskrivningsduration bland personer som redan är sjukskrivna
utvecklades. Den kan enkelt implementeras för datoranvändning. Grafiska modeller kan optimeras för
olika användare, såsom läkare, rehabkoordinatorer, etcetera.
Styrkor med modellen är att den baseras på mycket omfattande och reella data för samma typ av
population som den kommer att appliceras på. Prediktionsmodellen som utvecklats kan användas vid
olika situationer för att predicera framtida sjukfrånvaro för en person sjukskriven med en specifik
diagnos.
Den typ av data som använts i projektet är unika, även internationellt och kan användas för fördjupade
analyser och för prediktion även av sjukskrivningsduration för personer sjukskrivna i andra diagnoser.
Även data från andra register kan användas för detta ändamål, dock fanns det inte utrymme för detta
inom projektets tidsram.
I detta projekt har endast personer som faktiskt hade en pågående sjukskrivning som varat i mer än 14
dagar inkluderats. Det vore även av vikt att göra motsvarande analyser för personer som initialt har en
viss diagnos (sjukdom eller skada) och inte är sjukskrivna, för att studera risk att bli sjukskriven korta
eller långa perioder. Sådan kunskap efterfrågas från hälso- och sjukvården och behövs som underlag
för att utveckla kunskapsbaserade preventiva åtgärder.
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
3
2016-10-05
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 6 av 55
I rapporten används följande förkortningar och begrepp
Bruttodagar
Antal dagar med ersättning från Försäkringskassan för sjukskrivning eller sjuk- och
aktivitetsersättning
F43
Diagnoskod i ICD-10 för diagnos "Anpassningsstörningar och reaktion på svår stress"
Faktor
Ett värde på en variabel, till exempel kvinna i variabeln kön
FK
Försäkringskassan
H-region
Indelning av kommuner, efter hur urbana de är, såsom i Storstad, Mellanstor stad eller
Småorter
ICD-10
International Classification of Diagnoses, version 10 (1)
IMAS
Insurance Medicine All Sweden; den databas projektet baseras på
LISA
Longitudinell Integrationsdatabas för Sjukförsäkrings- och Arbetsmarknads-studier;
rikstäckande register administrerat av Statistiska centralbyrån
M75
Diagnoskod i ICD-10 för diagnos " Sjukdomstillstånd i skulderled"
MiDAS
MikroData för Analys av Socialförsäkringen; rikstäckande register administrerat av
Försäkringskassan
Nettodagar
Antal hela dagar med ersättning från Försäkringskassan för sjukskrivning eller sjuk- och
aktivitetsersättning. Dagar med partiell frånvaro är hopslagna till hela dagar.
SA
Sjuk- och aktivitetsersättning, tidigare förtidspension
Sensitivitet
Andel sant positiva prediktioner
Specificitet
Andel sant negativa prediktioner
SRS
Stöd för rätt sjukskrivning; namn på det projekt som denna rapport ingår i
Totala antalet
dagar
Antal dagar mellan anmälningsdagen och sista dagen med ersättning i ett
sjukskrivningsfall
Variabel
En grupp faktorer som utesluter varandra, till exempel kön som består av faktorerna man
och kvinna.
Rapporten är delvis skriven på engelska.
Abbreviations used in the English texts
DP
Disability pension
SA
Sickness absence
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
4
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 7 av 55
Inledning
Detta delprojekt utgår dels från det arbete som gjorts i två tidigare delprojekt inom ramen för SRSprojektet avseende prediktion av fortsatt sjukskrivning bland personer som har påbörjat ett
sjukskrivningsfall (2, 3), dels från diskussioner med SRS:s projektledningsgrupp.
Projektet, som är tvärvetenskapligt, har genomförts i samarbete med forskare vid Enheten för
biostatistik och vid Sektionen för försäkringsmedicin, Karolinska Institutet.
Framför allt har följande sex personer vid Karolinska Institutet arbetat med projektet (i
bokstavsordning):
- Kristina Alexanderson, professor i socialförsäkring, Dr i medicinsk vetenskap, Sektionen för
försäkringsmedicin, Institutionen för klinisk neurovetenskap (CNS) (projektledare;
[email protected])
- Matteo Bottai, professor i biostatistik, PhD in biostatistics, Enheten för biostatistik, Institutet
för miljömedicin (IMM)
- Paolo Frumento, forskarassistent, PhD in statistics, Enheten för biostatistik (IMM)
- Elin Hinas, statistiker, Sektionen för försäkringsmedicin (CNS)
- Kerstin Nilsson, statistiker, Sektionen för försäkringsmedicin (CNS)
- Petter Tinghög, forskarassistent, Fil dr, Sektionen för försäkringsmedicin (CNS)
4.1 Syfte
Syftet med detta delprojekt var att utveckla prediktiva modeller avseende duration av
sjukskrivningsfall i två olika sjukskrivningsdiagnoser.
5
Material och metod
Detta projekt utgår dels från det arbete som tidigare gjorts i två delprojekt inom ramen för SRSprojektet avseende prediktion av fortsatt sjukskrivning bland personer som har påbörjat ett
sjukskrivningsfall (2, 3), dels från diskussioner med SRS:s projektledningsgrupp.
5.1 Data
Analyserna baseras på information från en databas inom projektet Insurance Medicine All Sweden
(IMAS) som leds och administreras inom Sektionen för försäkringsmedicin, Karolinska Institutet.
Databasen innehåller avidentifierade individdata länkade från flera olika rikstäckande register för
samtliga personer i arbetsför ålder som registrerats som boende i Sverige vissa år. Projektet har
godkänts av den Regionala etikprövningsnämnden i Stockholm. För detta projekt har data från
följande sex register inom IMAS använts:
Från Försäkringskassan:
- MiDAS (MikroData för Analys av Socialförsäkringen) registret (4): information om sjukskrivningsfall
som ersatts av Försäkringskassan under åren 2008-2014. Ur registret hämtades information om
varje falls startdatum (startdatum 1/anmälningsdatum samt startdatum 2 vilket är den första dagen
med ersättning från Försäkringskassan) och slutdatum, omfattning (grad av deltid eller om heltid),
antal dagar med ersättning från Försäkringskassan (både brutto- och nettodagar), totala antalet
dagar i fallet (inklusive dagar utan ersättning från Försäkringskassan), försäkradtyp (typ av
sysselsättning) vid sjukskrivningsfallets start samt sjukskrivningsdiagnos (huvuddiagnosen i den
första sjukskrivningsperioden i sjukskrivningsfallet). Motsvarande information om sjuk- och
aktivitetsersättningar (tidigare kallat förtidspension eller sjukbidrag) inhämtades också från MiDAS.
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
2016-10-05
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 8 av 55
Detta innebär att information från både hel- och delfallsfiler i MiDAS har använts.
- Försäkringskassans register över personer som under åren 2009-2011 uppnått maximal tid i
sjukförsäkringen och datum för detta.
- Försäkringskassans register över personer som fått sin sjukpenning indragen samt datum för detta
under åren 2009-2011.
Från Statistiska centralbyrån:
- LISA-registret(5) (Longitudinell Integrationsdatabas för Sjukförsäkrings- och Arbetsmarknads-studier).
Baserat på data från LISA har vi tagit fram information om följande sociodemografiska variabler
för år 2011: ålder, kön, födelseland, högsta utbildningsnivå, yrke, sektor, familjesituation,
civilstånd och H-region (baserat på boendekommun).
Från Socialstyrelsen
- Dödsorsaksregistret information om datum för död och dödsorsak 2010-2013.
- Patientregistret, dels från Slutenvårdsregistret, vad avser information om tillfällen personer varit
inlagda på sjukhus, avseende: datum, antal dagar, samt huvud- och bidiagnoser under åren 20082011, dels från Öppenvårdsregistret, vad avser: datum för läkarbesök i specialiserad öppenvård för
olika diagnoser under åren 2008-2011 (Detta register innehåller inte information om besök i
primärvården).
5.1.1 Information i MiDAS
I MiDAS registreras sjukskrivningsfall där Försäkringskassan har betalat ut ersättning. Det innebär att
för de flesta anställda, där arbetsgivaren betalar sjuklön under de första 14 dagarna i ett
sjukskrivningsfall, får inte Försäkringskassan information om sjukskrivningsfallet om det inte
överstiger 14 dagar. Därför registreras inte de flesta sjukskrivningsfall som är kortare än 15 dagar i
MiDAS. För arbetslösa och vissa andra grupper för vilka Försäkringskassan betalar ut ersättning
tidigare i sjukskrivningsfallet finns kortare fall registrerade i MiDAS. För att inte introducera en bias
relaterat till dessa grupper inkluderades i denna rapports analyser endast sjukskrivningsfall som var
längre än 14 dagar.
För varje sjukskrivningsfall finns det två startdatum, dels dagen då personen sjukanmälde sig till sin
arbetsplats alternativt till Försäkringskassan (startdatum 1/anmälningsdatum) och dels datum för den
första dagen med ersättning från Försäkringskassan (startdatum 2).
Tre variabler används för beskrivning av antal dagar i ett sjukskrivningsfall. Den första beskriver
antalet dagar från anmälningsdagen till den sista dagen med ersättning, alltså då sjukskrivningsfallet
avslutades, detta kallas här för totala antalet dagar i fallet. När data från MiDAS ”tvättades” slogs alla
sjukskrivningsfall, som startade inom fem dagar efter att ett tidigare fall avslutats, samman med det
tidigare fallet. Detta på grund av återinsjuknande regeln, som innebär att personen får ersättning från
Försäkringskassan redan från dag 1 i det nya fallet. För sjukskrivningsfall med ersättningstyp
"förebyggande sjukskrivning" användes 14 dagar som gräns för sammanslagning, detta på grund av
sådana fall ofta upprepas inom det tidsintervallet. Vid beräkning av totala antalet dagar inkluderades
inte de mellanliggande dagarna, det vill säga dagar utan ersättning från Försäkringskassan togs inte
med.
Den andra variabeln är antal bruttodagar, som beskriver antalet dagar med ersättning från
Försäkringskassan. Dessa dagar är i de flesta fall lika med antalet dagar mellan den första dagen med
ersättning (startdatum 2) och den sista dagen med ersättning (slutdatum), men det finns
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
2016-10-05
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 9 av 55
sjukskrivningsfall där det förekommer dagar mitt i fallet där ingen ersättning har utbetalats, detta på
grund av till exempel uttagen semester eller fängelsestraff. Dessa dagar utan ersättning är inte
medräknade i variabeln bruttodagar men de är medräknade i variabeln totala antalet dagar.
I den tredje variabeln har antal bruttodagar räknats om till antalet nettodagar, det vill säga, antalet hela
dagar med ersättning. Till exempel omräknas fyra bruttodagar med en omfattning om 25 % av heltid
till en nettodag.
Information om sjukskrivningsdiagnos från Försäkringskassans MiDAS databas finns endast på
treställighetsnivå för ICD-10. Det innebär att information om sjukskrivningsdiagnoser på mer
detaljerad nivå inte funnits tillgängligt i detta projekt, då utgångspunkten varit MiDAS.
5.2 Två diagnoser; F43 och M75
Sjukskrivningsfall i en psykisk och i en muskuloskeletal sjukskrivningsdiagnos har, utifrån uppdraget,
analyserats. Efter diskussioner med SRS projektet valdes dels den diagnosgrupp som ökat mest;
stressrelaterade psykiska besvär (F43 enligt ICD-10 (1)) och dels skulderbesvär (sjukdomstillstånd i
skulderled; M75). Diagnosen F43 "Anpassningsstörningar och reaktion på svår stress" är en
övergripande diagnoskategori som inkluderar bland annat följande diagnoser: akut stressreaktion,
anpassningsstörning, posttraumatiskt stressyndrom och utmattningssyndrom. Diagnosen M75
"Sjukdomstillstånd i skulderled" inkluderar bland annat rotatorcuffsyndrom i skulderled och
impingementsyndrom i skulderled.
5.3 Socialstyrelsens försäkringsmedicinska beslutsstöd
Socialstyrelsens försäkringsmedicinska beslutsstöd (6) innehåller diagnosspecifika rekommendationer
för båda valda diagnoserna, det vill säga för F43 och M75.
5.3.1 F43
Diagnosen F43 innehåller fem underdiagnoser. Socialstyrelsens diagnosspecifika
försäkringsmedicinska beslutsstöd innehåller skilda rekommendationer för fyra av dessa
underdiagnoser (se nedan) – dock inte för den femte, nämligen F43.9 "ospecificerad reaktion på svår
stress".
Som framgår av texterna nedan är troligtvis utmattningssyndrom (F43.8) den vanligaste
sjukskrivningsdiagnosen bland de många långa sjukskrivningarna i diagnos F43. I beslutsstödet för
F43-diagnoserna görs inte skillnad på rekommendationerna beroende på patientens typ av arbete.
Akut stressreaktion - F43.0
"Arbete har normalt positiv effekt och sjukskrivning bör så långt möjligt undvikas. Arbetsförmågan kan vara helt
eller delvis nedsatt i 2-4 veckor."
Posttraumatiskt stressyndrom - F43.1
"Symtomens svårighetsgrad och varaktighet är vägledande vid bedömning av sjukskrivning. Stora individuella
skillnader förekommer. Arbete kan ha en positiv effekt på symtombilden och sjukskrivning bör i sådana fall
undvikas."
Anpassningsstörning (livskris, sorgreaktion) - F43.2
"I normalfallet och i frånvaro av annan psykisk störning eller kroppslig sjukdom är arbetsförmågan inte eller
endast obetydligt nedsatt och sjukskrivning är som regel inte aktuell. Om depression eller ångestsyndrom
utvecklas gäller rekommendationerna för dessa tillstånd."
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
2016-10-05
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 10 av 55
Utmattningssyndrom - F43.8
"För individer med ett uttalat och väldiagnostiserat utmattningssyndrom kan arbetsförmågan vara nedsatt under
avsevärd tid. Återhämtning, med hjälp av aktiv specialiserad rehabilitering, och successiv återgång i arbete, tar
inte sällan mer än 6 månader och i vissa fall upp till ett år eller längre."
5.3.2 M75
För M75 finns det en gemensam skrivning i det diagnosspecifika försäkringsmedicinska beslutsstödet
om de vanligaste besvären. Rekommendationerna varierar något beroende på om patientens arbete är
fysiskt tungt eller ej.
Skulder- och axelledsbesvär: M75.4, M75.3, M75.0, M75.1, M65.9B
"Kalkaxel och impingementsyndrom på dominant sida kan sätta ned arbetsförmågan helt i upp till 2 veckor. I fall
med arbete som huvudsakligen görs med armarna ovanför axelhöjd eller arbete med krav på god rörlighet i
axlarna kan arbetsförmågan vara begränsad i upp till 3 veckor.
I många fall behövs deltidssjukskrivning samt anpassning av arbetsförhållanden i väntan på andra åtgärder.
Samma förhållningssätt kan vara lämpligt vid sjukskrivning vid impingementsyndrom och tendinoser där
besvären bedöms ha samband med arbetet.
Efter operation vid impingementsyndrom på dominant sida kan arbetsförmågan vara nedsatt; vid lätt arbete i upp
till 3 veckor, vid medeltungt arbete i upp till 6 veckor och vid tungt arbete i upp till 12 veckor. Ibland kan
sjukskrivningstiden kortas vid icke dominant sida.
Efter rotatorcuffsutur på dominant sida kan arbetsförmågan vara nedsatt; vid lätt arbete upp till 6 veckor, vid
medeltungt arbete i upp till 12 veckor och vid tungt arbete i upp till 26 veckor. Ibland kan sjukskrivningstiden
kortas vid icke dominant sida.
Efter operation vid frusen skuldra varierar behovet av sjukskrivning beroende på typ av arbete. I ett icke
rörelsekrävande arbete kan arbetet återupptas redan efter några dagar medan det i ett tungt arbete med belastning
över axelnivå kan behövas upp till någon månads sjukskrivning."
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
2016-10-05
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 11 av 55
5.4 Studiepopulationer
För båda diagnoserna (F43 och M75) inkluderades samtliga personer som var 18-64 år den 31
december 2011 och som hade minst ett sjukskrivningsfall som uppfyllde följande kriterier:



startade under 2011 och varade i mer än 14 dagar (>14 dagar valdes för att inte introducera
bias, se ytterligare förklaring ovan)
första huvuddiagnosen i sjukskrivningsfallet var F43 respektive M75
första förmånstypen var sjukpenning (detta innebär att de personer som hade
rehabiliteringspenning, arbetsskadesjukpenning eller förebyggande sjukpenning vid
sjukskrivningsfallets start inte inkluderades.)
Detta resulterade i 32 542 personer för F43 och 7 598 personer för M75. Några av dessa hade fler än
ett fall som uppfyllde inklusionskriterierna (1 357personer (4,2 %) för F43 och 401 personer (5,3 %)
för M75), det kronologiskt första av dessa sjukskrivningsfall valdes inför analyserna.
Fokus i SRS projektet är, vid tidpunkten för detta delprojekts genomförande, på allmänläkare i
primärvården. Då det inte finns något rikstäckande register över besök i primärvården och det inte
framgår av MiDAS från vilken sjukvårdsenhet som sjukintyget har skrivits, använde vi följande
kriterier för att i så stor utsträckning som möjligt säkerställa att endast sjukskrivningar som genererats
i primärvården inkluderades i analyserna: Information togs fram om vilka sjukskrivna personerna som,
enligt patientregistret hade haft besök inom specialiserad öppenvård alternativt varit inlagd på sjukhus
i samband med starten av sjukskrivningsfallet. 'I samband med starten' definierades då som från 4
dagar före den första dagen i fallet till och med dag 8 i fallet. För F43 hade 4 254 personer (13,1 %)
sådan öppen- eller slutenvård i samband med starten av sitt första fall, för M75 var motsvarande antal
3 085 (40,6 %). De fall som hade öppen- eller slutenvård vid starten ansågs ha fått sitt första sjukintyg
utfärdat från ett sjukhus medan övriga ansågs ha fått sitt första sjukintyg utfärdat av läkare inom
primärvården. Det innebär att för F43 återstod 28 288 personer som ansågs ha fått sitt läkarintyg
utfärdat av läkare inom primärvården och dessa inkluderades således i analyserna. För M75 var
motsvarande antal 4 513 personer. Bakgrundsfaktorer för dessa fyra grupper presenteras i Tabell 2 och
Tabell 4.
5.5 Variabler
5.5.1 Utfall
Först skapades modeller som predicerar specifika orsaker till att ett sjukskrivningsfall avslutas. Ett
sjukskrivningsfall kan avslutas på grund av många olika anledningar, den vanligaste anledningen är att
personen i fråga återfår arbetsförmåga och återgår i någon typ av aktivitet (vanligen arbete, men det
kan också vara studier, arbetslöshet (det vill säga: söka arbete) eller föräldraledighet). Andra
anledningar kan vara att personen avlidit, blivit ålderspensionär, övergått till sjuk- eller
aktivitetsersättning alternativt emigrerat (Tabell 1).
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 12 av 55
Tabell 1. Olika orsaker till att ett sjukskrivningsfall avslutas, antal och andel personer vars fall avslutades på grund av dessa
olika orsaker bland samtliga personer i åldrarna 18-64 som år 2011 hade ett nytt sjukskrivningsfall i diagnoserna F43
(stressrelaterade psykiska diagnoser) respektive i M75 (Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar,
uppdelat på var första sjukintyget i fallet utfärdades.
F43
Orsak till avslut av fallet
M75
Primärvård
Sjukhus
Primärvård
Sjukhus
n (%)
n (%)
n (%)
n (%)
Samtliga
28288 (100,0)
4254 (100,0)
4513 (100,0)
3085 (100,0)
Avled
24 (0,1)
14 (0,3)
1 (0,0)
1 (0,0)
Sjukersättning
346 (1,2)
65 (1,5)
55 (1,2)
14 (0,5)
Fyllde 65 samma år
116 (0,4)
25 (0,6)
53 (1,2)
24 (0,8)
31 (0,1)
5 (0,1)
4 (0,1)
2 (0,1)
27771 (98,2)
4145 (97,4)
4400 (97,5)
3044 (98,7)
Emigrerade
Annan orsak
Därefter skapades modeller som predicerar längd på sjukskrivningsfallet. Då inkluderades endast de
fall som avslutades på grund av "annan orsak", alltså sjukfallet övergick inte till sjuk- eller
aktivitetsersättning och personen varken avled, fyllde 65 år eller emigrerade i samband med att fallet
avslutades. Utfallsmåttet i dessa modeller är totala antalet dagar, alltså antalet dagar från första dagen i
sjukskrivningsfallet (anmälningsdagen) till den sista dagen med ersättning från Försäkringskassan,
enligt ovan. I analyserna är de sjukskrivningsfall som översteg 1000 dagar exkluderade, detta innebar
att 47 sjukskrivningsfall exkluderades för F43 och att ett sjukskrivningsfall exkluderades i analyserna
av M75.
5.5.2 Prediktionsfaktorer i steg 1 i projektet
I det första steget i analyserna inkluderades information som allmänläkaren kan antas ha tillgång till
inom ramen för SRS projektet. Dit hör patientens kön, ålder, sysselsättningsstatus (yrkesarbetande,
arbetslös, studerande eller föräldraledig), sjukskrivningens omfattning i början (100, 75, 50 eller 25 %
av ordinarie arbetstid), månad när sjukskrivningen initierades samt om personen då samtidigt hade en
pågående partiell sjuk- eller aktivitetsersättning eller inte (Tabell 2).
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 13 av 55
Tabell 2. Bakgrundsfaktorer för samtliga personer i åldrarna 18-64 som år 2011 hade ett nytt sjukskrivningsfall i diagnoserna
F43 (stressrelaterade psykiska diagnoser) respektive i M75 (Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar,
uppdelat på var första sjukintyget i fallet utfärdades.
F43
Samtliga
M75
Primärvård
Sjukhus
Primärvård
Sjukhus
n (%)
n (%)
n (%)
n (%)
28288 (100,0)
4254 (100,0)
4513 (100,0)
3085 (100,0)
Kön
Kvinnor
21790 (77,0)
3098 (72,8)
2588 (57,3)
1351 (43,8)
Män
6498 (23,0)
1156 (27,2)
1925 (42,7)
1734 (56,2)
Åldersgrupper
18-30 år
3093 (10,9)
639 (15,0)
268 (5,9)
81 (2,6)
31-40 år
7113 (25,1)
1245 (29,3)
601 (13,3)
291 (9,4)
41-50 år
8941 (31,6)
1243 (29,2)
1438 (31,9)
923 (29,9)
51-64 år / (51-57 år för M75)
9141 (32,3)
1127 (26,5)
1197 (26,5)
946 (30,7)
1009 (22,4)
844 (27,4)
58-64 år
Sysselsättning vid fallets start
Anmälan från Arbetsgivare,
Personen omfattas av Sjuklön
25652 (90,7)
3627 (85,3)
4068 (90,1)
2716 (88,0)
Anställd Dag 1, Personen
omfattas ej av Sjuklön
224 (0,8)
55 (1,3)
27 (0,6)
25 (0,8)
Egenföretagare
426 (1,5)
86 (2,0)
198 (4,4)
149 (4,8)
98 (0,3)
15 (0,4)
16 (0,4)
20 (0,6)
1610 (5,7)
383 (9,0)
189 (4,2)
166 (5,4)
262 (0,9)
84 (2,0)
15 (0,3)
8 (0,3)
16 (0,1)
4 (0,1)
0 (0,0)
1 (0,0)
1122 (4,0)
107 (2,5)
104 (2,3)
38 (1,2)
50 %
3933 (13,9)
517 (12,2)
566 (12,5)
216 (7,0)
75 %
722 (2,6)
105 (2,5)
106 (2,3)
74 (2,4)
22511 (79,6)
3525 (82,9)
3737 (82,8)
2757 (89,4)
Egenföretagare och anställd
(kombinatör)
Arbetslös
Föräldraledig eller
Hemmamakeförsäkrad
Studerande
Omfattning vid start
25 %
100 %
Sjuk- eller aktivitetsersättning
Ingen
27278 (96,4)
4065 (95,6)
62 (1,4)
56 (1,8)
25 %
381 (1,3)
68 (1,6)
178 (3,9)
121 (3,9)
50 %
578 (2,0)
114 (2,7)
9 (0,2)
15 (0,5)
75 %
51 (0,2)
7 (0,2)
249 (5,5)
192 (6,2)
Inom SRS projektet antas även att allmänläkare i primärvården, inom ramen för SRS projektet,
kommer att kunna ha tillgång till information om tidigare sjukskrivningar respektive tidigare sjukeller aktivitetsersättning från Försäkringskassan. En frågeställning har då varit hur detaljerad sådan
information behöver vara för att kunna göra bra prediktioner i den kliniska vardagen. Därför har
analyser gjorts där flera olika mått på detta har använts. Dessa är
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson


Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 14 av 55
Antal bruttodagar/år, det vill säga antal dagar personen haft ersättning från Försäkringskassan.
Antal nettodagar/år. Nettodagar hanterar om ersättningen varit för hel- eller deltid.
Måtten har tagits fram dels för året innan det studerade sjukskrivningsfallet började, dvs för de 365
dagarna innan det datum som fallet påbörjades (År -1) och dels för ytterligare ett år tillbaka i tiden,
alltså mellan 730 och 366 dagar innan sjukskrivningsfallet påbörjades (År -2). Även för tidigare
sjukskrivningsfall har de 14 första dagarna i varje sjukskrivningsfall exkluderats, för att inte
introducera bias.
För att i analyserna kunna se om det har betydelse om personen till exempel tidigare varit sjukskriven
eller haft sjuk- eller aktivitetsersättning i samma diagnos eller inte, har antalet brutto- och nettodagar
beräknats dels totalt och dels uppdelat på olika diagnosgrupper. Följande fem kategorier har då
använts för F43:





Tidigare sjukskrivning i F43
Tidigare sjukskrivning i alla andra psykiska diagnoser (F00-F99 exkl. F43)
Tidigare sjukskrivning i muskuloskeletala diagnoser (M00-M99)
Tidigare sjukskrivning i någon av samtliga övriga somatiska diagnoser
Uppgift om diagnos saknas (denna kategori slogs i analyserna samman med ”övriga somatiska
diagnoser”)
Följande kategorier har använts för M75:





Tidigare sjukskrivning i M75
Tidigare sjukskrivning i alla andra muskuloskeletala diagnoser (M00-M99 exkl. M75)
Tidigare sjukskrivning i psykiska diagnoser (F00-F99)
Tidigare sjukskrivning i någon av samtliga övriga somatiska diagnoser
Uppgift om diagnos saknas (denna kategori slogs i analyserna samman med ”övriga somatiska
diagnoser”)
Dessa mått har alltså tagits fram dels för sjukskrivning och dels för sjuk- och aktivitetsersättning, dels
för bruttodagar och dels för nettodagar samt dels för första året innan och dels för andra året innan.
Detta innebär att 48 olika variabler har skapats och analyserats för varje diagnosgrupp.
I analyserna kategoriserades antal brutto- och nettodagar med tidigare sjukskrivning respektive sjukeller aktivitetsersättning enligt följande fyra kategorier (Tabell 3):




0 dagar
0-90 dagar
90-180 dagar
>180 dagar
Tabell 3. Sjukskrivningshistorik för samtliga personer i åldrarna 18-64 som år 2011 hade ett nytt sjukskrivningsfall i
diagnoserna F43 (stressrelaterade psykiska diagnoser) respektive i M75 (Sjukdomstillstånd i skulderled), som varade i mer än
14 dagar, uppdelat på var första sjukintyget i fallet utfärdades.
F43
M75
Primärvård
Sjukhus
Primärvård
Sjukhus
n (%)
n (%)
n (%)
n (%)
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Samtliga
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 15 av 55
28288 (100,0)
4254 (100,0)
4513 (100,0)
3085 (100,0)
23076 (81,6)
3257 (76,6)
3271 (72,5)
2290 (74,2)
4298 (15,2)
787 (18,5)
1028 (22,8)
636 (20,6)
90,25-180 dagar
586 (2,1)
136 (3,2)
144 (3,2)
126 (4,1)
>180 dagar
328 (1,2)
74 (1,7)
70 (1,6)
33 (1,1)
22550 (79,7)
3216 (75,6)
3223 (71,4)
2289 (74,2)
4279 (15,1)
718 (16,9)
1003 (22,2)
612 (19,8)
90,25-180 dagar
719 (2,5)
149 (3,5)
156 (3,5)
120 (3,9)
>180 dagar
740 (2,6)
171 (4,0)
130 (2,9)
64 (2,1)
Tidigare nettodagar med sjukskrivning
År -1
Inga dagar
0,25-90 dagar
År -2
Inga dagar
0,25-90 dagar
Tidigare sjuk- eller aktivitetsersättning, nettodagar
År -1
Inga dagar
26521 (93,8)
3933 (92,5)
4186 (92,8)
2877 (93,3)
0,25-90 dagar
217 (0,8)
38 (0,9)
179 (4,0)
113 (3,7)
90,25-180 dagar
596 (2,1)
95 (2,2)
106 (2,3)
76 (2,5)
>180 dagar
954 (3,4)
188 (4,4)
42 (0,9)
19 (0,6)
26254 (92,8)
3889 (91,4)
4146 (91,9)
2856 (92,6)
0,25-90 dagar
150 (0,5)
37 (0,9)
19 (0,4)
19 (0,6)
90,25-180 dagar
504 (1,8)
89 (2,1)
80 (1,8)
63 (2,0)
1380 (4,9)
239 (5,6)
268 (5,9)
147 (4,8)
År -2
Inga dagar
>180 dagar
I figurerna nedan visas andel personer som hade haft tidigare sjukskrivningsfall som varat i längre än
14 dagar (Figur 1 och Figur 3) samt andel personer som tidigare haft sjuk- eller aktivitetsersättning
(Figur 2 och Figur 4). För de fyra studerade grupperna visas detta uppdelat på diagnos för de tidigare
sjukskrivningsfallen eller tidigare sjuk- eller aktivitetsersättning samt för första respektive andra året
innan.
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
Sidan 16 av 55
Tidigare nettodagar med sjukskrivning - F43
12,0
Andel personer (%)
10,0
8,0
6,0
4,0
2,0
0,0
År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1
F43
Andra psyk.
Musk.
diagnoser diagnoser
Övriga
somatiska
diagnoser
F43
Primärvård, n=28288
0,25-90 dagar
Andra psyk.
Musk.
diagnoser diagnoser
Övriga
somatiska
diagnoser
Sjukhus, n=4254
90,25-180 dagar
>180 dagar
Figur 1. Andel (%) personer som under första (År -1) respektive andra (År -2) året innan det studerade sjukskrivningsfallet
påbörjades haft ett sjukskrivningsfall som varat i mer än 14 dagar, uppdelat på typ av diagnos, bland personer i åldrarna 1864 som år 2011 hade ett nytt sjukskrivningsfall i diagnos F43 (stressrelaterade psykiska diagnoser) respektive i M75
(Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar, uppdelat på var första sjukintyget i fallet utfärdades.
Tidigare nettodagar med sjuk- eller aktivitetsersättning - F43
4,0
Andel personer (%)
3,5
3,0
2,5
2,0
1,5
1,0
0,5
0,0
År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1
F43
Andra psyk.
Musk.
diagnoser diagnoser
Primärvård, n=28288
0,25-90 dagar
Övriga
somatiska
diagnoser
F43
90,25-180 dagar
Andra psyk.
Musk.
diagnoser diagnoser
Övriga
somatiska
diagnoser
Sjukhus, n=4254
>180 dagar
Figur 2. Andel (%) personer som under första (År -1) respektive andra (År -2) året innan det studerade sjukskrivningsfallet
påbörjades haft ett sjukskrivningsfall som varat i mer än 14 dagar, uppdelat på typ av diagnos, bland personer i åldrarna 1864 som år 2011 hade ett nytt sjukskrivningsfall i diagnos F43 (stressrelaterade psykiska diagnoser) respektive i M75
(Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar, uppdelat på var första sjukintyget i fallet utfärdades.
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
Sidan 17 av 55
Tidigare nettodagar med sjukskrivning - M75
14,0
Andel personer (%)
12,0
10,0
8,0
6,0
4,0
2,0
0,0
År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1
M75
Andra musk. Psykiska
diagnoser diagnoser
Övriga
somatiska
diagnoser
M75
Primärvård, n=4513
0,25-90 dagar
Andra musk. Psykiska
diagnoser diagnoser
Övriga
somatiska
diagnoser
Sjukhus, n=3085
90,25-180 dagar
>180 dagar
Figur 3. Andel (%) personer som under första (År -1) respektive andra (År -2) året innan det studerade sjukskrivningsfallet
påbörjades haft ett sjukskrivningsfall som varat i mer än 14 dagar, uppdelat på typ av diagnos, bland personer i åldrarna 1864 som år 2011 hade ett nytt sjukskrivningsfall i diagnos F43 (stressrelaterade psykiska diagnoser) respektive i M75
(Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar, uppdelat på var första sjukintyget i fallet utfärdades.
Tidigare nettodagar med sjuk- eller aktivitetsersättning - M75
4,5
Andel personer (%)
4,0
3,5
3,0
2,5
2,0
1,5
1,0
0,5
0,0
År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1 År -2 År -1
M75
Andra musk. Psykiska
diagnoser diagnoser
Primärvård, n=4512
0,25-90 dagar
Övriga
somatiska
diagnoser
M75
90,25-180 dagar
Andra musk. Psykiska
diagnoser diagnoser
Övriga
somatiska
diagnoser
Sjukhus, n=3085
>180 dagar
Figur 4. Andel (%) personer som under första (År -1) respektive andra (År -2) året innan det studerade sjukskrivningsfallet
påbörjades haft ett sjukskrivningsfall som varat i mer än 14 dagar, uppdelat på typ av diagnos, bland personer i åldrarna 1864 som år 2011 hade ett nytt sjukskrivningsfall i diagnos F43 (stressrelaterade psykiska diagnoser) respektive i M75
(Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar, uppdelat på var första sjukintyget i fallet utfärdades.
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
Sidan 18 av 55
Då det kan tänkas att den månad då sjukskrivningsfallet startade kan ha samband med hur långt fallet
blir, inkluderades även denna faktor i steg 1. I Figur 5 presenteras hur stor andel av
sjukskrivningsfallen i F43 respektive M75 som påbörjades varje månad, i relation till om
sjukskrivningen började inom primärvården eller inom sjukhusvården.
12,0
10,0
8,0
6,0
4,0
2,0
0,0
Sjukhus
Primärvård
Sjukhus
F43, n=35 542
Primärvård
M75, n=7 598
Januari
Februari
Mars
April
Maj
Juni
Juli
Augusti
September
Oktober
November
December
Figur 5. Andel (%) personer vars sjukskrivningsfall startade en specifik månad under år 2011 bland personer i åldrarna 18-64
som år 2011 hade ett nytt sjukskrivningsfall i diagnos F43 (stressrelaterade psykiska diagnoser) respektive i M75
(Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar, uppdelat på var första sjukintyget i fallet utfärdades.
5.5.3 Prediktionsfaktorer i steg 2 i projektet
I steg 2 har ytterligare variabler lagts till, variabler som finns tillgängliga i IMAS-databasen och som
forskargruppen har anledning att tro skulle påverka utfallet, baserat i tidigare studier,
litteraturöversikter och diskussioner med praktiker och SRS-projektet. Dessa variabler är: födelseland,
typ av boenderegion (H-region), utbildningsnivå, familjesituation, civilstatus, typ av yrke samt
arbetssektor (Tabell 4). För 22 personer som var sjukskrivna i diagnos F43 och för en person som var
sjukskriven i diagnos M75 saknades information gällande de variabler som presenteras i Tabell 4,
dessa personer exkluderades ur analyserna i steg 2.
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 19 av 55
Tabell 4. Bakgrundsfaktorer för samtliga personer i åldrarna 18-64 som år 2011 hade ett nytt sjukskrivningsfall i diagnoserna
F43 (stressrelaterade psykiska diagnoser) respektive i M75 (Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar,
uppdelat på var första sjukintyget i fallet utfärdades.
F43
Samtliga
Födelseland
Sverige
Primärvård
Sjukhus
Primärvård
Sjukhus
n (%)
n (%)
n (%)
n (%)
28268 (100,0)
4252 (100,0)
4512 (100,0)
3085 (100,0)
24575 (86,9)
3547 (83,4)
3546 (78,6)
2621 (85,0)
Övriga Norden
873 (3,1)
104 (2,4)
233 (5,2)
154 (5,0)
Övriga EU25
602 (2,1)
89 (2,1)
98 (2,2)
56 (1,8)
2218 (7,8)
512 (12,0)
635 (14,1)
254 (8,2)
2605 (9,2)
497 (11,7)
1019 (22,6)
600 (19,4)
Gymnasium (10-12 år)
12953 (45,8)
2019 (47,5)
2851 (63,2)
1802 (58,4)
Eftergymnasial (≥13 år)
12710 (45,0)
1736 (40,8)
642 (14,2)
683 (22,1)
11455 (40,5)
1919 (45,1)
1310 (29,0)
1090 (35,3)
Mellanstor stad
9549 (33,8)
1344 (31,6)
1773 (39,3)
1034 (33,5)
Småorter
7264 (25,7)
989 (23,3)
1429 (31,7)
961 (31,2)
4016 (14,2)
536 (12,6)
918 (20,3)
730 (23,7)
11945 (42,3)
1664 (39,1)
1697 (37,6)
1255 (40,7)
8218 (29,1)
1411 (33,2)
1358 (30,1)
842 (27,3)
3955 (14,0)
606 (14,3)
518 (11,5)
248 (8,0)
134 (0,5)
35 (0,8)
21 (0,5)
10 (0,3)
15142 (53,6)
2439 (57,4)
2312 (51,2)
1404 (45,5)
13126 (46,4)
1813 (42,6)
2200 (48,8)
1681 (54,5)
Sektor
Information saknas
1947 (6,9)
442 (10,4)
277 (6,1)
138 (4,5)
Offentliga sektorn
12220 (43,2)
1574 (37,0)
1352 (30,0)
874 (28,3)
Privata sektorn
14101 (49,9)
2236 (52,6)
2883 (63,9)
2073 (67,2)
Yrke1
Saknar yrke
968 (3,4)
207 (4,9)
211 (4,7)
115 (3,7)
Tjänsteman
13688 (48,4)
1767 (41,6)
613 (13,6)
879 (28,5)
Arbetare
13612 (48,2)
2278 (53,6)
3688 (81,7)
2091 (67,8)
Övriga världen
Utbildningsnivå
Grundskola (≤9 år)
H-region
Storstad
Familjesituation
Gift/sambo, utan hemmavarande
barn
Gift/sambo, med hemmavarande
barn
Ensamstående, utan hemmavarande
barn
Ensamstående, med hemmavarande
barn
Hemmaboende ungdom, <20år
Civilstånd
Ogift, skild, änka/änkling
Gift, registrerat partnerskap
1
M75
Denna kategorisering är baserad på första nivån på SSYK som anger yrkesområde. I gruppen
Tjänstemän ingår yrkesområdena ledningsarbete, arbete som kräver teoretisk specialkompetens, arbete
som kräver kortare högskoleutbildning samt militärt arbete. I gruppen Arbetare ingår samtliga övriga
grupper.
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 20 av 55
Två ytterligare faktorer relaterat till sjukskrivningshistorik inkluderades i steg 2, dessa var att innan
den studerade sjukskrivningen ha uppnått maximal tid i sjukförsäkringen samt att tidigare fått sin
sjukpenning indragen.
Tabell 5. Tidigare uppnådd maxtid i sjukförsäkringen samt tidigare indragen sjukpenning för samtliga personer i åldrarna 1864 som år 2011 hade ett nytt sjukskrivningsfall i diagnoserna F43 (stressrelaterade psykiska diagnoser) respektive i M75
(Sjukdomstillstånd i skulderled), som varade i mer än 14 dagar, uppdelat på var första sjukintyget i fallet utfärdades.
F43
Samtliga
Tidigare uppnådd maxtid i
sjukförsäkringen
Tidigare indragen sjukpenning
M75
Primärvård
Sjukhus
Primärvård
Sjukhus
n (%)
n (%)
n (%)
n (%)
28268 (100,0)
4252 (100,0)
4512 (100,0)
3085 (100,0)
1411 (5,0)
260 (6,1)
153 (3,4)
50 (1,6)
580 (2,1)
132 (3,1)
128 (2,8)
65 (2,1)
Även variabler om antal besök i specialiserad öppenvård och antal dagar inom slutenvården (alltså
antal dagar med inläggning på ett sjukhus) har inkluderats. Dessa var beräknade dels för första året
innan och dels för andra året innan datumet då det studerade sjukskrivningsfallet påbörjades samt dels
för alla besök och inläggningar oavsett diagnos och dels uppdelat på olika diagnosgrupper på samma
sätt som variablerna om diagnoserna för tidigare sjukskrivning och sjuk- och aktivitetsersättning (se
ovan, sidan 14). För slutenvård fanns det diagnoser registrerade för samtliga inläggningar, det vill säga,
det var inga i kategorin ”Uppgift om diagnos saknas”.
Två typer av ICD koder togs inte med i dessa beräkningar. Dels ”Spontanförlossning vid enkelbörd”
(O80), dels Z-koderna (Z00-Z99); "Faktorer av betydelse för hälsotillståndet och för kontakter med
hälso- och sjukvården”, det vill säga, besök som inte rör sjukdom eller skada, utan kontakter i
samband med screening, utredning etcetera. Vi inkluderade dock en Z-kod, nämligen Z73 – ”Problem
som har samband med svårigheter att kontrollera livssituationen”. I analyserna kategoriserades de i
detta stycke beskrivna 22 variablerna (per diagnos) baserat på medianen bland dem som hade minst ett
besök eller minst en dag med inläggning (Tabell 6):



Inga besök respektive inga dagar med inläggning
Mellan ett besök respektive en dag med inläggning upp till och med medianen av antalet
besök eller dagar med inläggning bland de som hade minst ett besök eller minst en dag med
inläggning
Mer än medianen bland dem som hade minst ett besök respektive minst en dag med
inläggning.
Medianen av antalet besök inom specialiserad öppenvård, bland dem som hade minst ett besök, var ett
eller två besök, beroende på diagnos för besöket. Även medianen av antalet dagar med inläggning på
sjukhus (slutenvård) varierade med diagnosen som orsakade inläggningen. Maximala antalet dagar
med inläggning för dem som var sjukskrivna i F43 var 247 dagar under första året innan och 268 dagar
under andra året innan. För dem som var sjukskrivna i diagnosen M75 var motsvarande siffror 136
respektive 57 antal dagar. Orsaken till dessa långa inläggningar var mentala diagnoser.
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 21 av 55
Tabell 6. Tidigare specialiserad öppenvård samt slutenvård för samtliga personer i åldrarna 18-64 som år 2011 hade ett nytt
sjukskrivningsfall i diagnoserna F43 (stressrelaterade psykiska diagnoser) respektive i M75 (Sjukdomstillstånd i skulderled),
som varade i mer än 14 dagar, uppdelat på var första sjukintyget i fallet utfärdades.
F43
Samtliga
M75
Primärvård
Sjukhus
Primärvård
Sjukhus
n (%)
n (%)
n (%)
n (%)
28268 (100,0)
4252 (100,0)
4513 (100,0)
3085 (100,0)
År -1
Inga besök
16631 (58,8)
1172 (27,6)
2434 (53,9)
273 (8,8)
1-2 besök
7897 (27,9)
1560 (36,7)
1374 (30,5)
1454 (47,1)
>2 besök
3740 (13,2)
1520 (35,7)
704 (15,6)
1358 (44,0)
År -2
Inga besök
17118 (60,6)
1934 (45,5)
2565 (56,8)
1422 (46,1)
1-2 besök
7560 (26,7)
1237 (29,1)
1275 (28,3)
1009 (32,7)
>2 besök
3590 (12,7)
1081 (25,4)
672 (14,9)
654 (21,2)
26409 (93,4)
3398 (79,9)
4192 (92,9)
2764 (89,6)
1126 (4,0)
514 (12,1)
151 (3,3)
178 (5,8)
733 (2,6)
340 (8,0)
169 (3,7)
143 (4,6)
År -2
Inga dagar
26293 (93,0)
3737 (87,9)
4153 (92,0)
2764 (89,6)
1-3 dagar
1097 (3,9)
232 (5,5)
198 (4,4)
185 (6,0)
>3 dagar
878 (3,1)
283 (6,7)
161 (3,6)
136 (4,4)
Öppenvård
Slutenvård
År -1
Inga dagar
1-3 dagar (1-2 för M75)
>3 dagar (>2 för M75)
5.6 Analysmetoder
5.6.1 Predictive models
Predictive models are used in many clinical settings to help physicians and patients make prognoses
and decisions about treatments. In public health settings, predictive models represent an essential tool
for forecasting into the future for establishing policies and regulations. Over time, much research has
focused on developing statistical methods to construct and validate predictive models. The literature
available on this topic is vast, and references can be requested of the Unit of Biostatistics at Karolinska
Institutet.
Developing predictive models require taking a number of steps, which may be simplified into the
following main ones: (1) identify the object to predict, (2) identify all possible predictors, (3) develop
an prediction algorithm, and (4) validate its performance in terms of sensitivity, specificity, prediction
error, or other appropriate measures.
The above steps are taken in order to develop the prediction model for the present project. The
following sections expand on each step.
5.6.1.1 Identifying the object of prediction
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
Sidan 22 av 55
In a series of meetings with representatives from the SRS project, it was agreed to start with
individuals who began a sick-leave spell with a specific diagnosis; F43. In the analyses now conducted,
information on all people with a first such sick-leave spell in 2011 due to F43 that lasted for more than
14 days and probably was issued in primary health care by a general practitioner was utilized. The
object of prediction was the duration of the spell. More details about the study population, definition
of the duration and the collection of the data are described above.
The duration of a sick-leave spell is expressed in days and varies between individuals and between
different spells for the same individual. In statistical jargon, the duration is a random variable that
takes on values on the set of natural numbers (days). The distribution of the spells is much skewed to
the right. In some analyses, all spells longer than two years were recorded in the statistical analyses as
censored at two years, in others they were excluded. The distribution showed preferred values of spell
duration, such as one week, two weeks, one month, six months, and one year.
The aim of the predictive model was to estimate the shape of the distribution of duration for each of
the different types of individuals. For example, Figur 6 shows two different types of individuals. The
proportion of individuals still on sickness absence at any given time point are reported on the y-axis.
Ninety percent of type A individuals go out of the spell gradually over a range of several months,
while ninety percent of type B individuals go out of it in about one-month time. These intervals are
shaded in gray in Figure 1. The prediction for type A individuals is less precise than for type B
individuals.
Type A individuals
Type B individuals
1.0
1.0
Proportion on SA
Proportion on SA
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
0.5
0.5
0.0
0.0
0
180
Days on SA
365
0
180
Days on SA
365
Figur 6. Distribution of sick-leave spell duration in two different hypothetical populations of individuals; the shaded
intervals indicate the period elapsing between the time 5% and 95% of the individuals were out of the sick-leave spell.
5.6.1.2 Identifying all possible predictors
All experts involved agreed on defining a minimal set of predictors that would be readily available to
the clinicians, who are the intended users of the predictive models. In addition to the minimal set, a
number of other possible predictors were identified that could be made available to the clinicians, if
they were shown to improve the prediction substantially.
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
2016-10-05
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 23 av 55
5.6.1.3 Developing a prediction algorithm
We developed a prediction algorithm in several steps. The object of prediction was the distribution of
sick-leave spell duration. We started off by stratifying all individuals into subgroups based on sex and
categories of age, current occupational status, and duration of previous sick-leave spells and disability
pension. This gave us the opportunity to explore the data.
Stratification, however, does not constitute the optimal predictive model. Even with our large sample
size, stratifying on many factors leads to small number of observations in any given stratum. In
addition, estimating each stratum separately entails estimating a very large number of parameters in
the predictive models. Besides, stratifying on numeric variables (e.g., age) may be unjustified. For
example, it is reasonable to expect that if age is an important predictor, then the distribution of spell
duration would vary across age values smoothly. That is, the distribution in 30-year-olds should not be
very different from that in 31-year-olds.
Age was introduced as a numeric predictor. Regression splines were utilized to check for non-linearity
of its effect. Unlike stratification, this entailed introducing very few regression parameters, yielding
much greater efficiency in the estimation of their values. The same was repeated for all numeric
predictors in the models. The distribution of spell duration was modeled very flexibly by means of
piece-wise exponential models.
5.6.1.4 Validating the predictive model
In general, predictive models are developed based on available data. The accuracy of their prediction
is often measured by sensitivity, specificity, prediction error, reclassification proportion, or other
related measures. However, it is quite simple to construct a predictive model that would accurately
predict the outcome on each individual in the dataset. This issue is sometimes referred to as “data
over-fitting”. The problem with over-fitting is that the good performance of a predictive model with
the observed data may not be replicated when the model is applied to new individuals who were not
part of the original dataset used to develop the model. Several statistical methods have been proposed
to estimate the possible true performance of predictive models on new individuals. When external data,
not used to develop the models, are available, these can be utilized to assess the model’s performance.
When external data are not available, then internal validations are performed. These are usually based
on resampling techniques, which consist of splitting the available data in training and validation
subsets, iteratively many times.
While internal validations are the best one can generally do, they suffer from lacking real external data.
Sub-setting the available data, results in getting similar copies of the same population, which the study
population the sample was taken from. For example, if a predictive model is developed on data from
individuals living in Stockholm, there is no guarantee that that model would work well if applied to
individuals living in Tokyo, Japan, unless data from Tokyo were made available to validate the model.
In our present project we are in the very enviable position that we have data from all Sweden and it is
the very population of Sweden the predictive models are meant to be used on. This makes lack of
validating data much less of an issue than in other, more common, settings. The only assumption we
need to make is that what happened in 2011, the year our here used data covers, is not very different
from what might happen today in the years to come. This assumption cannot be verified until new data
become available. It would be recommendable to update the predictive model, as more recent data
become available.
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
6
2016-10-05
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 24 av 55
Resultat
Den första fasen i detta delprojekt har varit att ta fram analysdatafiler för de analyser som ska
genomföras, det vill säga att besluta om initiala avgränsningar av vad/vilka som ska studeras och av
vilka prediktorer som ska läggas in i modellerna, i de olika stegen (steg 1 och steg 2) för de båda
studerade diagnoserna samt att genomföra analyser i steg 1. Detta var det som haft störst tidsåtgång.
Sedan har analyserna i steg 2 utförts.
Nedan presenteras centrala resultat från analyserna. Ytterligare resultat presenteras i de två bilagorna,
en bilaga för varje diagnos. Resultat i termer av algoritmer och syntax har levererats till SRS projektet.
6.1 Prediction of SA spell for F43 and M75 diagnoses
Aims:
 To predict the final outcome of a spell
 To predict the duration of a SA spell that terminates with ”back to work”
Example. George is 59, male, he was born in England, has a degree, is married and has two sons.
He is currently on sick leave with this and that diagnosis and medical history. What can we say
about his future?
Will George go back to work?
If yes, when?
6.2 A note on prediction
6.2.1 Definition
We speak of prediction whenever we try to make a meaningful “guess” about future values of a
response variable of interest, y, based on a set of predictors, denoted by x. For example, age and
education are good predictors of wages; smoking habits, body mass index, and nutrition can be used to
predict cardiovascular disease; wind, humidity, and temperature today can predict future weather, and
so on. By studying the association between x and y in a training dataset, we can build a predictive
model to be used to predict the value of y at new values of x.
6.2.2 Predictive models
To characterize the distribution of y, given x, one could simply compute some summary statistics (e.g.,
the mean, the median) for homogeneous sub-populations. For example, individuals who are similar to
George (same age, sex, socio-economic status, etcetera) could be used to predict what will happen to
George. This is very inefficient in practice, as the number of subjects like George may be very small,
if not zero. Using a statistical model permits borrowing information from George’s neighbours (e.g.,
those who have a similar age) at the cost of some structural assumptions.
For example, one could use a linear model in which y = a + b*x + e, assuming that the mean value of y is
a linear function of x. In most real situations, however, the effect of x is likely to be nonlinear; and the
distribution of y is usually skewed and may present outliers. To achieve a sufficient flexibility, we
used a form of piecewise constant hazard model with time-varying coefficients, as implemented in the
R package pch, version 2.1. (Details in Section 6.3.3.)
6.2.2.1 Use of predictive models
Suppose we have data on various risk factors (age, sex, smoking habits, body mass index, diabetes,
…) in Sweden in 2016; and we implement a statistical model that predicts the risk of cardiovascular
disease.
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson


2016-10-05
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 25 av 55
Can we use this model to predict the number of cardiovascular events in Sweden in 2017? The
answer is yes, assuming that the distribution of the risk factors and their association with the
response variable will not change sharply in one year from now.
Can we apply the same model to Japan? The answer is maybe, or maybe not. The Japanese
population has a very different structure, and a number of unobserved characteristics (e.g.,
genetic factors) that are likely to modify the association between the known predictors and the
response variable. Applying the Swedish model to the Japanese population may yield
inaccurate predictions.
In the present framework, we are using Swedish data to implement a prediction model to be applied to
the same population. This means that our predictions will always be accurate. On the other hand,
whether predictions are precise or not (for example, how large is a 90% prediction interval) depends
on the strength of the available predictors.
When x is strongly associated with y, as in the left figure below (Figur 7), predictions will be
narrower; individuals with different values of x will also have quite different predictions. When the
association is weaker, as in the middle figure, predictions will be less precise, and all individuals will
have roughly the same prediction interval. Note that significance does not imply that prediction
is ”good”: for example, the right figure below illustrates a significant linear association between x and
y (p-value < 0.001, thanks to a large sample size), but predictions are rather poor.
Figur 7. Examples of associations between two variables: x and y.
6.3 Prediction models for F43 and M75
In the rest of the document, we will denote sickness absence by SA and disability pension by DP. The
goal was to predict the final outcome of SA (going back to work, death, DP 100%, turning 65,
emigrating) and, for those who went back to work, the duration of SA (total days).
6.3.1 Predictors
We used two sets of predictors. In a first version of the model (steg 1), we used:

Age
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson






Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 26 av 55
Sex
Occupation (in work/unemployed/student)
Month of start of SA
Extent of SA at start (part time (25, 50 or 75 %) or full time (100 %))
History of SA an DP (sick-leave history), categorized in different groups
Extent of partial DP at the start of SA
At a second stage (steg 2), the following additional predictors were included:










Birthplace (Sweden, other nordic, other EU25, other world)
Living area (big/medium/small city)
Education (low/medium/high)
Family status (with/without partner and living with or without children)
Marital status (married/not married)
Sector (public/private)
Occupation (white/blue collar)
Have previously reached maximum time of possible sick-leave days
Previously been denied prolongation of SA benefit
History of in- and outpatient visits categorized in different group.
Information on “sick-leave history” variables was available for one and for two years before the index
spell. The history of SA and DP could be coded in four different ways:




(net_by) net days, by diagnosis
(net_all) net days, all diagnoses
(gross_by) gross days, by diagnosis
(gross_all) gross days, all diagnoses
Similarly, the history of in/outpatient visits could be classified as by/all. We implemented the model
using all different definitions of the “history” variables, and compared the results.
Selected plots illustrating the distribution of the available predictors and their association with the
duration of SA are reported in Appendix I and II.
6.3.2 Predicting the final outcome of a spell
We used a multinomial logistic model, as implemented by the nnet R package. This type of regression
is used to model the distribution of a categorical response variable with 3 or more levels. The observed
distribution of the outcome variables in F43 is shown in Tabell 7:
Tabell 7. The different possible outcomes of a sick-leave spell and their distribution among individuals in ages 18-64 who in
2011 had a new SA-spell in diagnosis F43 (stress-related mental diagnoses), that lasted more than 14 days and for which the
first sickness certificate was issued in primary health care.
Outcome
Other (back to work or other activity)
Died at the end of SA
DP 100% at the end of SA
Turning 65 or older that year
Emigrated
n
27771
24
346
116
31
%
98.2
0.1
1.2
0.4
0.1
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
Sidan 27 av 55
We implemented various different models, as described in Section 6.3.1: in particular, we first used a
reduced set of predictors, and only later we included all the available information; and we tried using
different definitions of “sick-leave history”. For example, Tabell 8 shows the performance of the “big”
model (steg 2), using different definition of “history”, for F43. Net days were always slightly better
predictors than gross days, although the difference in terms of performance was not substantial. The
“all” formulation has fewer parameters, which yields a better value of AIC and BIC. However, for the
sake of generality, we suggest using the “by” formulation, in which a variable for each diagnostic
group is included. The prediction is about 98% accurate with all models (see also figures in Appendix
I). Similar results were obtained for M75 and are not reported for brevity.
Tabell 8. Measures of the model’s performance for four different models predicting the outcomes in Tabell 7, using the
extended set of predictors and applying different “history” variables, for diagnosis F43: number of parameters, maximized
log-likelihood, Akaike and Bayesian information criterion (AIC and BIC), and proportion of correct predictions.
number of parameters
max -log likelihood
AIC
BIC
% correct
net by
492
1469
3921
7980
98
gross by
492
1502
3989
8047
98
net all
236
1630
3709
5557
98
gross all
236
1638
3723
5571
98
A prediction from the model (steg 2) using net days by diagnoses for sick-leave history will
correspond to the probability distribution for George’s final outcome presented in Tabell 9.
Tabell 9. Distribution of predicted outcome of the SA-spell for the fictional individual George.
Outcome
Died at the end of SA
DP 100% at the end of SA
Turning 65 or older that year
Emigrated
Other (back to work or other activity)
Chance of outcome (%)
1.4
0.9
0.7
0.0
97.0
6.3.3 Predicting the duration of SA for those who go back to work or other activity
We used a piecewise-constant hazard model with time-dependent covariates' effect (R package pch,
version 1.2). Briefly, the time line is divided into k breaks, and a different Exponential model is fitted
within each sub-interval. The value of k is meant to increase with the sample size: we use k = 20 for
F43, where about 20,000 observations were available; and k = 5 for M75, where the sample size was
less than 5,000. Model parameters are fitted via maximum likelihood. The advantage of this approach
is that the model is flexible enough to always guarantee a good approximation of the data distribution.
Also in this case, we first used a reduced set of predictors (steg 1), and later included all the available
information (steg 2); and we implemented a different model for each definition of the “history”
variables. We can say that the model with more predictors is “42% better” than that with fewer
predictors, for F43, based on the ratio between the pseudo R-squared values (Tabell 10); and “65%
better” for M75.
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
Sidan 28 av 55
The following table illustrates the pseudo R-squared of the model with fewer predictors and that of the
richer model, in F43 and M75.
Tabell 10. Pseudo R-squared values for the models with fewer predictors (steg 1) and the models with more predictors (steg
2), for both F43 and M75.
Diagnosis
F43
M75
R2 steg 1
0.017
0.013
R2 steg 2
0.024
0.021
Ratio steg 2/steg 1
1.42
1.65
To compare the performance of different “sick-leave history” variables, we used likelihood criteria
(Tabell 11). The differences were negligible, which did not allow us to endorse one specific model.
We believe that the “net_by” formulation is quite general and can be applied to all diagnoses. Only
results for F43 are presented in the table, similar results were obtained for M75 but are not reported
here.
Tabell 11. Measures of the models performance for four different models predicting the duration of the SA spell, using the
extended set of predictors and applying different “history” variables, for diagnosis F43: number of parameters, maximized
log-likelihood, Akaike and Bayesian information criterion (AIC and BIC),
number of parameters
max -log likelihood
AIC
BIC
net by
2420
150974
306783
326671
gross by
2420
150987
306806
326686
net all
1140
151744
305644
314514
gross all
1140
151733
305623
314493
We used pseudo R-squared and likelihood criteria to rank the predictors based on their importance. In
Tabell 12 and in Tabell 13 these measures are presented for the top 10 variables for each of the two
diagnoses. We report the number of parameters associated with each predictor (df), the log-likelihood
loss when the predictor is removed, the p-value of the corresponding likelihood ratio test, and the
pseudo partial R-squared (R2, multiplied by 100) associated with the predictor.
It can be seen that in both diagnoses, the most relevant variable was the month at which the SA started.
The history of SA and DP due to the same diagnoses was always more important than that for other
diagnoses. Also the type of employment was relevant for both diagnoses. For F43 (which refers to
stress-related mental diagnoses), an important variable was represented by the family status; while for
M75 (shoulder disorders), the age was a fundamental predictor.
Tabell 12. The ten most important predictive factors in the model for duration of the SA spell due to diagnosis F43, using the
extended set of predictors (steg 2) and applying net days by diagnoses of sick-leave history.
SA month
Sector
SA extent at start
Occupation
Family status
DP extent at start
Previously reached MaxTime
degrees of
freedom (df)
220
40
20
60
78
20
20
log-likelihood
loss
393
165
149
100
104
80
68
p-value
100*R2
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.26
0.11
0.10
0.07
0.07
0.05
0.05
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
SA F43 -1 year net
SA F43 -2 year net
DP Musc -1 year net
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
60
60
60
80
63
54
Sidan 29 av 55
0.000
0.000
0.000
0.05
0.04
0.04
Tabell 13. The ten most important predictive factors in the model for duration of the SA spell due to diagnosis M75, using
the extended set of predictors (steg 2) and applying net days by diagnoses of sick-leave history.
SA month
Visits M75 -1 year
Age
DP Mental -1 year net
Occupation
Birth country
Previously reached MaxTime
SA Other -1 year net
SA M75 -2 year net
SA Mental -1 year net
degrees of
freedom (df)
55
10
5
15
10
15
5
15
15
15
log-likelihood
loss
50
37
16
15
36
15
15
15
14
12
p-value
100*R2
0.000
0.000
0.000
0.015
0.000
0.016
0.000
0.022
0.027
0.055
0.20
0.15
0.06
0.06
0.14
0.06
0.06
0.06
0.05
0.05
6.4 Prediction tools
We implemented an R function that generates predictions from the fitted model. The prediction can be
from day 0, or from any day after the SA spell started. Users can choose the quantiles to predict
(default at quartiles), the coverage of prediction intervals (default: 90, 80, and 50%), and the time
points for which to compute the probability to go back to work or to other activity. Below, we present
an example by predicting George’s outcome (Tabell 14). And below we illustrate the predictions for
another individual than George with a curve (Figur 8).
The quantiles show that there is a 25% chance that George's SA spell will be 24 days or shorter, 50%
chance that it will be 38 days or shorter and 75% chance that it will be 84 days or shorter. The
predicted intervals indicate that there is a 90% chance that his SA spell will become between 17 and
266 days long, and there is a 50% chance that it will be 24 to 84 days long. There is a risk of 63% that
his spell will be longer than 30 days, 12% risk that it will be longer than 6 months and 1% risk that it
will become longer than two years. All these predictions are valid if George´s spell doesn't end due to
any of the four reasons stated at the bottom in Tabell 14. There is also unfortunately a 1.4% risk that
George's spell will end due to his death.
Tabell 14. Predictions from day 0 for the individual George.
Predicted quantiles
1st quartile
median
3rd quartile
Duration of SA; days
24
38
84
Prediction intervals
90%
80%
50%
Duration of SA; range
17 – 266 days
19 – 200 days
24 – 84 days
Probabilities
days
P(Duration of SA > days)
%
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
2016-10-05
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
30
60
90
180
365
730
63
33
24
12
3
1
Predicted reason for end of SA
Died at the end of SA
DP 100% at the end of SA
Turning 65 or older that year
Emigrated
%
1.4
0.9
0.7
0.0
Sidan 30 av 55
Figur 8. Survival function for another individual then George, for each time in years the curve represents the probability that
George's SA spell will become longer than that (e.g. P(SA>6 months)=20%).
To assess the quality of the predictions, we generated 90% prediction intervals for all individuals used
to fit the models, and computed the intervals widths. The narrowest intervals correspond to more
precise predictions. The distribution of the intervals’ width for both F43 and M75 is represented below
(Figur 9), using all predictors (steg 2), and defining SA history as “net_by”. For F43 there are quite a lot
of individuals with wide 90% prediction intervals, this indicates that even if the model is very accurate
(korrekta) it is not very precise (exakta). Predictions for M75 are generally narrower; note, however,
that some prediction intervals are very long for both diagnoses. There are small subgroups in which
prediction is very precise, yielding a narrow prediction interval.
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
2016-10-05
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
F43
Bilaga 5 Prediktionsmodeller, duration
Sidan 31 av 55
M75
Figur 9. Histogram of the width of 90 % prediction intervals based on the fitted models (steg 2 and "net_by") for all
individuals used to fit the models (i. e. individual's first sickness certificate issued in primary health care and SA spell ended
due to "other cause or back to work").
To improve prediction, additional covariates (e.g., medications) could be added to the model. Note
that the performance of the prediction model may be very different for other diagnoses. In particular,
there may be diagnoses for which prediction is rather simple, and others for which the available
information is not enough to formulate a precise model.
7
Concluding remarks
The implemented model is very flexible and general. This means that it could be applied, almost with
no supervision, to any other diagnosis, which would allow a sort of “industrial production” of
predictive models. The main issue is represented by the availability of predictors, on one hand; and by
their ability to generate a sufficiently narrow prediction.
We did not perform an internal cross-validation of the predictive models because of the following
reasons: (1) the sets of predictors in the two predictive models listed in section 6.3.1 were selected
based on a-priori knowledge and practical relevance, not on statistical significance of their coefficients
or goodness-of-fit measures; (2) all the predictors were introduced as linear covariates and no further
modeling was attempted; and (3) as described in section 5.6.1.4, the predictive models were based on
data from all of Sweden, which was the very population the predictive models are meant to be used on.
Different diagnoses are expected to have a different response in terms of SA, and very different
predictors. For example, the duration of SA associated with a fracture may strongly depend on age,
while the clinical history may be a more relevant predictor for a psychiatric disorder.
Ideally, a different prediction model should be implemented for each diagnostic group. Considering
two or more similar diagnoses as members of the same "group" permits increasing the sample size and
the statistical power. However, it may generate inaccurate predictions if the members of the diagnostic
group are not homogeneous. Another option is to consider broad diagnostic groups, and use the type of
diagnosis as an additional predictor. For example, we could implement a single model for different
types of fracture, and include the type of fracture as a covariate. This may result in a more
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 32 av 55
parsimonious and efficient model, especially if the effect of other predictors (age, sex, etc) can be
assumed to be the same across all types of fracture.
The diagnostic groups can be defined in different ways. There are not strong requirement for how the
data should be prepared. In principle, a different set of predictors could be used for each diagnostic
group. However, in order to formulate a general template, we expect the data to have a standard format.
To be processed by our estimating function, the data should include:
- the duration of SA (e.g., days in terms of net or gross days)
- all (and preferably only) the predictors to be used: age, sex, history of SA and DP, education,
occupation, etc.
Finally, we emphasize that the outcome of a prediction model can also be used to suggest actions to
take in order to reduce the duration of SA. For example, if a specific condition is known to be a
relevant risk factor, interventions may be planned to provide support to individuals with that condition.
We believe that these data are a great source of information. Future research should be planned to
make the best use of it.
R packages that were used for the analyses:
nnet: Feed-Forward Neural Networks and Multinomial Log-Linear Models, version 7.3-12 (7)
pch: Piecewise Constant Hazards Models for Censored and Truncated Data, version 1.2 (8).
8
Diskussion
Resultat av projektet, i form av algoritmer och koder för prediktionsmodeller, är möjligt att börja
använda direkt. Framtagande av motsvarande modeller för andra diagnoser behövs också och
resultaten vad avser prediktionsförmågan varierar troligen mycket med diagnos.
De här genomförda analyserna skulle naturligtvis kunnat göras annorlunda, till exempel vad avser
inkluderingar och exkluderingar av personer och sjukskrivningsfall samt vad gäller såväl val av
variabler som kategorisering av de olika variablerna. Möjligen skulle andra val kunna leda till andra
prediktioner. Ytterligare analyser behövs för fördjupad förståelse av dessa mycket komplexa fenomen,
som underlag för att kunna genomföra såväl primärpreventiva som rehabiliterande åtgärder.
Framförallt är det centralt, för hälso- och sjukvårdens hantering av patienter, att även genomföra
analyser av faktorer som predicerar att en patient överhuvudtaget blir sjukskriven bland alla patienter
med olika diagnoser, det vill säga, inte enbart genomföra analyser av de som redan är sjukskrivna.
Eftersom datamaterialet som dessa modeller baseras på täcker hela Sveriges befolkning i åldrarna 1664 år och det har inte skett några stora förändringar i försäkringssystemet sedan 2011 så är
prediktioner som baseras på de framtagna modellerna relativt korrekta. Men de är, speciellt för
diagnos F43, inte särskilt exakta. Särskilt när det gäller F43 bör det beaktas att flera olika diagnoser
ingår i denna kategori, diagnoser med mycket olika förväntat sjukskrivningsduration. Intervallen på
predicerad sjukskrivningsduration är relativt breda för de flesta personer. Det kan bero på flera saker,
bland annat att det finns faktorer som påverkar sjukskrivningsdurationen som vi inte har (kunnat)
inkludera i dessa modeller eller att durationen till stor del beror på slumpen.
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Sidan 33 av 55
Appendix I – Selected figures F43
4000
6000
8000
days of SA
2000
> 2y
0
Frequency
9
Bilaga 5 Prediktionsmodeller, duration
0
200
400
days of SA
Histogram of day of SA
600
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
sex
4000
Histogram of age
Sidan 34 av 55
3000
F
work
2000
p.leave
1000
unemp.
0
M
20
30
40
age
50
60
Distribution of age, sex, and occupation (16 students omitted)
[18,35]
(35,50]
(50,66]
1000
800
0
200
400
600
800
600
400
200
0
0
200
400
600
800
1000
sex
1000
age
F
M
p.leave
Boxplot of days of SA, by age, sex, and occupation
stud
unemp.
work
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
living area
0
0
2000
5000
4000
10000
6000
15000
8000
20000
10000
place of birth
Sidan 35 av 55
SW
Other N
EU25_excl_N
World
big city
600
400
days of SA
0
200
400
200
0
days of SA
village
living area
600
place of birth
medium
SW
Other N
EU25_excl_N
World
big city
Top: distribution of birth place and living area.
Bottom: boxplot of days of SA.
medium
village
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
education
400
0
0
2000
200
4000
6000
days of SA
8000
10000
600
12000
education
Sidan 36 av 55
Low
Medium
High
Low
Left: distribution of education level.
Right: boxplot of days of SA, by education level.
Medium
High
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
marital status
0
0
2000
2000
4000
4000
6000
6000
8000
8000
10000
12000
10000
14000
family status
Sidan 37 av 55
partner
partner+
single
single+ Living with child
Not married
Married
< 20 years old
400
days of SA
0
200
400
200
0
days of SA
600
marital status
600
family status
partner
partner+
single
single+
Living with child
< 20 years old
Not married
Married
Top: distribution of family and marital status. The symbol “+” indicates the presence of children.
Bottom: boxplot of days of SA, by family and marital status.
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
occupation
0
0
2000
2000
4000
4000
6000
6000
8000
8000
10000
10000
12000
12000
sector
none
public
private
none
wh/coll
blue/coll
400
200
0
0
200
400
days of SA
600
occupation
600
sector
days of SA
Sidan 38 av 55
none
public
private
none
Top: distribution of sector/occupation status.
Bottom: boxplot of days of SA.
wh/coll
blue/coll
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
Sidan 39 av 55
month
400
0
0
500
200
1000
1500
days of SA
2000
600
2500
SA start (month)
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
Left: distribution of month at which SA started.
Right: boxplot of days of SA, by month.
800
600
0
200
400
days of SA
600
400
200
0
days of SA
800
1000
extent of SA at start
1000
extent of DP at start
0
0.25
0.5
0.75
0.25
0.5
Boxplot of days of SA, by extent of DP and SA at start.
0.75
1
12
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
800
600
days of SA
0
200
400
600
400
0
200
days of SA
800
1000
net SA Musc year -1
1000
net SA F43 year -1
0
0-90
90-180
>180
0
0-90
90-180
>180
800
600
days of SA
0
200
400
0
200
400
600
800
1000
net SA Other year -1
1000
net SA Other Mental year -1
days of SA
Sidan 40 av 55
0
0-90
90-180
>180
0
0-90
90-180
>180
Boxplot of days of SA, by net days of SA in the year before, by cause (F43, muscular, other mental,
other).
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
800
600
days of SA
0
200
400
600
400
0
200
days of SA
800
1000
net SA Musc year -2
1000
net SA F43 year -2
0
0-90
90-180
>180
0
0-90
90-180
>180
800
600
days of SA
0
200
400
0
200
400
600
800
1000
net SA Other year -2
1000
net SA Other Mental year -2
days of SA
Sidan 41 av 55
0
0-90
90-180
>180
0
0-90
90-180
>180
Boxplot of days of SA, by net days of SA two years before, by cause (F43, muscular, other mental,
other).
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
800
600
days of SA
0
200
400
600
400
0
200
days of SA
800
1000
net DP Musc year -1
1000
net DP F43 year -1
0
0-90
90-180
>180
0
0-90
90-180
>180
800
600
days of SA
0
200
400
0
200
400
600
800
1000
net DP Other year -1
1000
net DP Other Mental year -1
days of SA
Sidan 42 av 55
0
0-90
90-180
>180
0
0-90
90-180
>180
Boxplot of days of SA, by net days of DP in the year before, by cause (F43, muscular, other mental,
other).
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
800
600
days of SA
0
200
400
600
400
0
200
days of SA
800
1000
net DP Musc year -2
1000
net DP F43 year -2
0
0-90
90-180
>180
0
0-90
90-180
>180
800
600
days of SA
0
200
400
0
200
400
600
800
1000
net DP Other year -2
1000
net DP Other Mental year -2
days of SA
Sidan 43 av 55
0
0-90
90-180
>180
0
0-90
90-180
>180
Boxplot of days of SA, by net days of DP two years before, by cause (F43, muscular, other mental,
other).
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
Sidan 44 av 55
days of SA (simulated)
4000
Frequency
4000
Frequency
6000
6000
8000
8000
days of SA (true)
> 2y
0
0
2000
2000
> 2y
0
200
400
pmin(days, 731)
600
0
200
400
600
pmin(s, 731)
True (left) vs fitted (right) distribution of the duration of SA. The histogram on the right is obtained by
generating random numbers from the fitted model.1
1
The left histogram comes from the real data. The right one is made from simulated data, which means
that if I repeat the simulation is repeated, slightly different results will be generated. The figure aims to
illustrate how close the fitted model is to the true distribution, and not to assess the "numerical
difference" between the true distribution and the fitted one.
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
Sidan 45 av 55
10 Appendix II – selected figures M75
500
> 2y
0
Frequency
1000
1500
days of SA
0
200
400
days of SA
Histogram of the number of SA days
600
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
Histogram of age
Sidan 46 av 55
sex
600
800
F
400
unemp.
p.leave
200
work
0
M
20
30
40
age
50
60
[18,35]
(35,50]
(50,66]
1000
800
0
200
400
600
800
600
400
200
0
0
200
400
600
800
1000
sex
1000
age
F
M
Top: distribution of age, sex, and occupation.
Bottom: boxplot of days of SA.
p.leave
unemp.
work
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
Sidan 47 av 55
month
400
0
0
100
200
200
days of SA
300
600
400
SA start (month)
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
Left: distribution of the month on which SA starts.
Right: boxplot of the SA days, by month.
800
600
0
200
400
days of SA
600
400
200
0
days of SA
800
1000
extent of SA at start
1000
extent of DP at start
0
0.25
0.5
0.75
0.25
0.5
0.75
1
Boxplot of SA days, by extent of DP (left) and SA (right) at start.
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
marital status
0
0
500
500
1000
1000
1500
2000
1500
family status
Sidan 48 av 55
partner
partner+
single
single+
Not married
400
days of SA
0
200
400
0
200
days of SA
600
marital status
600
family status
Married
partner
partner+
single
single+
Living with
child < 20
years old
Not married
Married
Top: _distribution of family status.
Bottom: boxplot of days of SA, by family status. The symbol “+” indicates presence of children.
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
education
400
0
0
500
200
1000
1500
days of SA
2000
600
2500
education
Sidan 49 av 55
Low
Medium
High
Low
Left: distribution of education.
Right: boxplot of SA days, by education.
Medium
High
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
living area
0
0
500
500
1000
1500
2000
1000
2500
3000
1500
3500
place of birth
Sidan 50 av 55
SW
Other N
EU25_excl_N
World
big city
600
400
days of SA
0
200
400
200
0
days of SA
village
living area
600
place of birth
medium
SW
Other N
EU25_excl_N
World
big city
medium
village
Top: distribution of birthplace and living area.
Bottom: boxplot of SA days, by birthplace and living area.
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
3000
4000
>180
0
90-180
>180
0
0-90
90-180
>180
90-180
>180
1000
800
800
days of SA
600
0
200
days of SA
0
200
400
800
600
400
200
0
0
0-90
net SA Other year -1
1000
net SA Mental year -1
1000
net SA M75 year -1
0-90
600
90-180
400
0-90
0
0
1000
1000
2000
2000
3000
3000
2000
1000
0
0
days of SA
net SA Other year -1
4000
net SA Mental year -1
4000
net SA M75 year -1
Sidan 51 av 55
0
0-90
90-180
>180
0
0-90
90-180
Top: distribution of net days of SA in the year before, by cause (M75, mental, other)
Bottom: boxplot of SA days.
>180
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
3000
4000
>180
0
90-180
>180
0
0-90
90-180
>180
90-180
>180
1000
800
800
days of SA
600
0
200
days of SA
0
200
400
800
600
400
200
0
0
0-90
net SA Other year -2
1000
net SA Mental year -2
1000
net SA M75 year -2
0-90
600
90-180
400
0-90
0
0
1000
1000
2000
2000
3000
3000
2000
1000
0
0
days of SA
net SA Other year -2
4000
net SA Mental year -2
4000
net SA M75 year -2
Sidan 52 av 55
0
0-90
90-180
>180
0
0-90
90-180
Top: distribution of net days of SA two years before, by cause (M75, mental, other)
Bottom: boxplot of SA days.
>180
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
net DP Mental year -1
3000
4000
0
>180
0
90-180
>180
0
0-90
90-180
>180
90-180
>180
1000
800
800
days of SA
600
0
200
days of SA
0
200
400
800
600
400
200
0
0
0-90
net DP Other year -1
1000
net DP Mental year -1
1000
net DP M75 year -1
0-90
600
90-180
400
0-90
0
1000
1000
2000
2000
3000
4000
3000
2000
1000
0
0
days of SA
net DP Other year -1
4000
net DP M75 year -1
Sidan 53 av 55
0
0-90
90-180
>180
0
0-90
90-180
Top: distribution of net days of DP in the year before, by cause (M75, mental, other)
Bottom: boxplot of SA days.
>180
2016-10-05
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Version 1.00
Alexanderson, Bottai, Frumento, Hinas, Nilsson
Bilaga 5 Prediktionsmodeller, duration
net DP Mental year -2
3000
4000
0
>180
0
90-180
>180
0
0-90
90-180
>180
90-180
>180
1000
800
800
days of SA
600
0
200
days of SA
0
200
400
800
600
400
200
0
0
0-90
net DP Other year -2
1000
net DP Mental year -2
1000
net DP M75 year -2
0-90
600
90-180
400
0-90
0
1000
1000
2000
2000
3000
4000
3000
2000
1000
0
0
days of SA
net DP Other year -2
4000
net DP M75 year -2
Sidan 54 av 55
0
0-90
90-180
>180
0
0-90
90-180
Top: distribution of net days of DP two years before, by cause (M75, mental, other)
Bottom: boxplot of SA days.
>180
Stöd för rätt sjukskrivning
Dnr SKL: 14/3621
Alexanderson, Bottai, Frumento, Hinas, Nilsson
2016-10-05
Version 1.00
Bilaga 5 Prediktionsmodeller, duration
Sidan 55 av 55
11 Referenser, i urval
1. International
Statistical Classification of Diseases and Related Health Problems 10th Revision,
Version for 2007: WHO; 2010 [cited 2010 March 26]. http://www.who.int/classifications/icd/en/].
2. Alexanderson K, Bottai M, Frumento P, Hinas E, Nilsson K, Kjeldgård L, Tinghög P. Prediktion av
fortsatt sjukskrivning respektive av långtidssjukskrivning bland sjukskrivna personer.
Försäkringskassan och Sverige Kommuner och Landsting (SKL), 2016.
3. Hinas E, Nilsson K, Tinghög P, Mittendorfer-Rutz E, Alexanderson K. Prediktion av fortsatt
sjukfrånvaro bland personer sjukskrivna i depressiv episod respektive i artros (Bilaga 5,
Förstudierapport Stöd för rätt sjukskrivning; SRS). Försäkringskassan och Sverige Kommuner och
Landsting (SKL), 2015.
4. MiDAS Sjukpenning och rehabiliteringspenning. Försäkringskassan, 2011.
5. Longitudinell Integrationsdatabas för Sjukförsäkrings- och Arbetmsmarknadsstudier (LISA) 1990
till 2009. SCB, 2011.
6. Försäkringsmedicinskt beslutsstöd - vägledning för sjukskrivning (reviderad 2012). Stockholm:
Socialstyrelsen; 2012.
7. Venables W, Ripley B. Modern Applied Statistics with S. 4th ed. NY: Springer; 2002.
8. Frumento P. pch: Piecewise Constant Hazards Models for Censored and Truncated Data.: R package
version 1.2, url: http://CRAN.Rproject.org/package=pch; 2016.