Mikael Andersson - Statistikkonsulterna

Kossor, tallsteklar och
sockerärter
Statistik vid Sveriges Lantbruksuniversitet
Mikael Andersson Franko
Universitetslektor i matematisk statistik
Enheten för tillämpad statistik och matematik
SLU i hela Sverige
SLU är ett rikstäckande universitet med
verksamhet på många orter. De största
campus ligger i Alnarp, Skara, Umeå och
Uppsala.
Bildades 1977 genom en sammanslagning
av lantbrukshögskolan i Ultuna, veterinäroch skogshögskolan i Stockholm,
Alnarpsinstitutet, skogsmästarskolan i
Skinnskatteberg samt djursjukhuset i
Skara.
Verksamhetsidé
SLU utvecklar kunskapen om de
biologiska naturresurserna och människans
förvaltning och hållbara nyttjande av dessa.
Detta sker genom utbildning, forskning och
miljöanalys i samverkan med det
omgivande samhället.
Vision
SLU är ett universitet i världsklass inom
livs- och miljövetenskaper.
Organisation
Näringsdepartementet
Styrelsen för SLU
SLU Holding AB
Universitetsadministration
Universitetsdjursjukhuset
Rektor
Bibliotek
Fakulteten för
landskapsarkitektur,
trädgårds- och
växtproduktionsvetenskap
Internrevision
Fakulteten för
naturresurser och
jordbruksvetenskap
Fakulteten för
veterinärmedicin och
husdjursvetenskap
Institutioner och enheter
Fakulteten för
skogsvetenskap
23 program på grundnivå
Kandidat/yrkesprogram
Biologi - bioteknik
Biologi och miljövetenskap
Djursjukskötare
Ekonomi
Etologi och djurskydd
Hippolog
Landskapsingenjör
Lantmästare
Skogsmästare
Trädgårdsingenjör – design
Trädgårdsingenjör – odling
Längre yrkesprogram
Agronom – ekonomi
Agronom – husdjur
Agronom – landsbygdsutveckling
Agronom – livsmedel
Agronom – mark/växt
Civilingenjör i energisystem (UU)
Civilingenjör i miljö- och vattenteknik (UU)
Hortonom
Jägmästare
Landskapsarkitekt – Alnarp
Landskapsarkitekt – Ultuna
Veterinär
Kurser i statistik
Grundutbildning
Forskarutbildning
Umeå
•
Matematisk statistik 7.5 hp
•
Matematisk statistik, 7.0 hp
•
Multivariat dataanalys, 7.5 hp
•
Regressionsanalys, 7.5 hp
•
Spatial statistik, 7.5 hp
•
Tidserieanalys, 7.5 hp
Uppsala
• Statistics I: Basic statistics, 4 hp
• Statistics II: Experimental Design and ANOVA, 4
hp
• Statistics III: Regression Analysus, 4 hp
• Statistics IV: Generalized and Mixed Linear
Models, 4 hp
Uppsala
•
Grundläggande statistik för ekonomer, 5.0 hp
•
Grundläggande statistik för biologer, 5.0 hp
•
Grundläggande statistik och matematik, 10.0 hp
•
Biologisk matematik och statistik, 7.5 hp
•
Biologisk statistik, 5.0 hp
•
Variansanalys och försöksplanering, 5.0 hp
•
Grundläggande matematisk statistik, 5.0 hp
Alnarp
•
Grundläggande biologisk statistik, 5.0
•
Kemi, Ekologi och Statistik
•
Teknologiska och biologiska grunder för odling
(1.0 hp statistik för trädgårdsingenjörer och
hortonomer)
Alnarp
• Research Design, 3 hp
• Treatment of data, 4.5 hp
Umeå
• Applied Logistic Regression, 7.5 hp
• Basic Sampling theory with applications, 4 hp
Biostokastikum
• Fakultetsövergripande centrum med ansvar för stöd i
statistik i form av konsultuppdrag, deltagande i
forskningsprojekt, kurser och workshops.
• Instiftades 2010 för att höja kvaliteten på statistiktillämpning på SLU.
• Årlig budget på 2Mkr.
• ≈10 statistiker på 4 institutioner.
Case study: Kossor
I en foderstudie delades 54 kossor in slumpmässigt i tre lika
stora fodergrupper omedelbart efter kalvning. Fodret i de tre
grupperna blandades ut med 50%, 70% respektive 90%
silage. Kossorna följdes och vägdes regelbundet under ett
år. En kossa i behandlingsgrupp 2 utgick p.g.a. dålig hälsa.
Finns en skillnad i viktökning mellan de tre grupperna?
Modell
Blandad linjär modell för upprepade mätningar
𝑦𝑦𝑖𝑖𝑖𝑖𝑖𝑖 = 𝜇𝜇 + 𝛽𝛽𝑖𝑖 𝑥𝑥𝑘𝑘 + 𝑎𝑎𝑗𝑗 + 𝑏𝑏𝑗𝑗 𝑥𝑥𝑘𝑘 + 𝑒𝑒𝑖𝑖𝑖𝑖𝑖𝑖
𝑎𝑎𝑗𝑗 ∈ 𝑁𝑁 0, 𝜎𝜎𝑎𝑎
𝑏𝑏𝑗𝑗 ∈ 𝑁𝑁(0, 𝜎𝜎𝑏𝑏 )
𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑒𝑒𝑖𝑖𝑖𝑖𝑘𝑘1 , 𝑒𝑒𝑖𝑖𝑖𝑖𝑘𝑘2 = 𝜌𝜌 𝑥𝑥𝑘𝑘1 −𝑥𝑥𝑘𝑘2
𝑖𝑖 = fodergrupp (1,2,3)
𝑗𝑗 = kossa (1,2,…,53)
𝑘𝑘 = tidpunkt
Resultat
Linear mixed-effects model fit by REML
AIC
BIC
logLik
5183.263 5221.787 -2582.631
Random effects:
Formula: ~lweek | cownr
StdDev
Corr
(Intercept) 65.0694790 (Intr)
lweek
0.8572557 -0.033
Residual
23.1328046
Correlation Structure: Continuous AR(1)
Formula: ~lweek | cownr
Parameter estimate(s):
Phi
0.5547614
Fixed effects: vikt ~ fgrupp:lweek
Value Std.Error DF t-value p-value
(Intercept)
546.8686 9.172727 482 59.61898 < 2e-16 ***
fgrupp1:lweek
1.8208 0.243445 482 7.47933 3.56e-13 ***
fgrupp2:lweek
1.6731 0.247141 482 6.76963 3.76e-11 ***
fgrupp3:lweek
0.9108 0.244942 482 3.71855 2.24e-04 ***
Case study: Tallsteklar
Ett experiment gjordes för att uppskatta predation av
tallstekellarver. Totalt 81 granar valdes ut i tre geografiska
områden (Asa, Uppsala och Vindeln) och grupper om cirka
20 larver sattes ut på två grenar på varje träd. Ena grenen
täcktes av ett finmaskigt nät för att skydda larverna från
rovdjur. Varje vecka under fem veckors tid räknades antal
larver på varje gren.
Modell
Hierarkisk blandad logistisk regression för upprepade
mätningar
log𝑖𝑖𝑖𝑖 𝑝𝑝𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 = 𝜇𝜇 + 𝛼𝛼𝑖𝑖 + 𝛽𝛽𝑖𝑖 𝑥𝑥𝑙𝑙 + 𝛾𝛾𝑘𝑘 𝑥𝑥𝑙𝑙 + 𝑎𝑎𝑗𝑗 + 𝑏𝑏𝑗𝑗𝑗𝑗 + 𝑒𝑒𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖
𝑎𝑎𝑗𝑗 ∈ 𝑁𝑁 0, 𝜎𝜎𝑎𝑎
𝑏𝑏𝑗𝑗𝑗𝑗 ∈ 𝑁𝑁 0, 𝜎𝜎𝑏𝑏
𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑒𝑒𝑖𝑖𝑖𝑖𝑖𝑖𝑙𝑙1 , 𝑒𝑒𝑖𝑖𝑖𝑖𝑖𝑖𝑙𝑙2 = 𝜌𝜌 𝑥𝑥𝑙𝑙1 −𝑥𝑥𝑙𝑙2
𝑖𝑖 = område (1,2,3)
𝑗𝑗 = träd (1,2,…,81)
𝑘𝑘 = behandling (1,2)
𝑙𝑙 = tidpunkt (1,2,3,4,5)
Resultat
Linear mixed-effects model fit by maximum likelihood
Random effects:
Formula: ~1 | Tree
(Intercept)
StdDev: 0.3998026
Formula: ~1 | Treatment %in% Tree
(Intercept) Residual
StdDev: 0.6895878 1.292731
Correlation Structure: AR(1)
Formula: ~Week | Area/Tree/Treatment
Parameter estimate(s):
Phi
0.7356289
Fixed effects
Value Std.Err
(Intercept)
1.9883819 0.17111
AreaUppsala
-0.6425863 0.23171
AreaVindeln
-1.2379368 0.25074
Week
-0.1278001 0.03120
AreaUppsala:Week
0.0645199 0.03725
AreaVindeln:Week
0.0361457 0.04000
Week:TreatmentOpen -0.3332178 0.02550
DF
t-value p-value
596 11.620397 0.0000
72 -2.773209 0.0071
72 -4.937092 0.0000
596 -4.095346 0.0000
596
1.731631 0.0839
596
0.903492 0.3666
596 -13.067079 0.0000
Behandlingseffekter
Vecka
Skattning
Oddskvot
Konfidensintervall
1
0.33
1.4
1.3 – 1.5
2
0.67
1.9
1.8 – 2.2
3
1.00
2.7
2.3 – 3.2
4
1.33
3.8
3.1 – 4.6
5
1.67
5.3
4.1 – 6.8
Case study: Sockerärter
Under perioden 2010-2014 samlade Findus in data över
skörd av sockerärter per hektar och 16 övriga variabler på
2445 fält i Halland och Skåne.
Vilka variabler påverkar skörden mest och hur skall man
maximera skörden av sockerärter?
Variabler
1. Sort (10 olika sorter odlades)
2. Sådatum (från 20:e mars till 25:e juni)
3. Planttäthet (2 -163 plantor/kvm)
4. Förfrukt (höstspannmål, vårspannmål, potatis/morötter, sockerbetor, träda)
5. Jordart (lättlera, mellanlera, sand)
6. Plöjning (höstplöjning, vårplöjning, plöjningsfritt)
7. Harvningsdjup (3 - 20 cm)
8. Såteknik (skivbill, släpbill)
9. Sådjup (3 - 10 cm)
10. Gödsling (stallgödsel, nedharvad, kombination, ogödslat)
11. Vältning (vid sådd, efter uppkomst, ingen vältning)
12. pH-värde (1.9 - 8.6)
13. Fosforhalt (2 - 160)
14. Kaliumhalt (1.7 - 55.0)
15. Magnesiumhalt (1 - 62)
16. Kalciumhalt (11 - 2000)
Resultat
Hur är det att vara statistiker på
SLU?
”The best thing about being a statistician is that you
get to play in everyone’s backyard”
John Tukey (1915-200)