Tacodan multi-indækningsbånd

Vækstmodeller
Henrik L. Pedersen
Institut for Grundvidenskab og Miljø
Det Biovidenskabelige Fakultet
Københavns Universitet
16. september 2010
1
Matematiske modeller generelt
Matematiske modeller i naturvidenskab omhandler beskrivelse af virkelighedens naturvidenskabelige fænomener vha. matematik. Det kræver kendskab til et naturvidenskabeligt fagområde, til matematik og statistik og til it. Formålet med denne case er at give eksempler på
modellering inden for det biovidenskabelige område. Hovedeksemplet er dosis-respons kurver og særligt et fænomen, der går under betegnelsen hormesis. Som det vil fremgå kræver en
forståelse af dette kendskab til økotoksikologi, matematik (funktionsundersøgelse), statistik
(kurvetilpasning foruden metoder til parameterestimater, standardafvigelser og signifikans,
der tages op senere) og it (beregninger og visualisering). Vi vil bruge Maple som it-værktøj i
denne case, skønt statistikprogrammet R nok er mere naturligt at bruge (R introduceres senere
i uddannelsen). Fokus i denne case vil være at belyse hvordan en given model beskrives vha
matematiske værktøjer og visualiseres ved it.
En matematisk model skal på den ene side være så simpel, at den kan håndteres og på den
anden side være så kompliceret, at den giver et nogenlunde retvisende billede af virkeligheden.
En matematisk model kan (i varierende grad) være teoretisk funderet, dvs. baseret på veletablerede teorier inden for fx fysik eller kemi. Modeller kan også i højere grad være empirisk funderede – og her er det ikke altid muligt at begrunde modellens formler teoretisk, men i højere
grad at vælge på basis af observerede data. Dette er ofte tilfældet med matematiske modeller
inden for biologividenskab, fordi målingerne ofte vil være et resultat af en kombination af
mange (og komplicerede) processer.
Forbindelsen mellem på den ene side matematiske funktioner og på den anden side observerede data er først og fremmest kurvetilpasning. Vi beskriver derfor kort dette værktøj.
1
2
Kurvetilpasning
Igennem to forskellige punkter i XY-planen går netop en ret linje! Dette er utvivlsomt rigtigt,
men måske ikke så let at arbejde med, hvis man har en mængde punkter i planen som ser ud til
næsten, og kun næsten, at ligge på en ret linje. Hvordan afgør man hvilken ret linje der passer
bedst med punkterne? Svaret er: man benytter lineær regression!
For at beskrive, hvad denne metode går ud på skal vi have lidt notation. Vi tænker os, at der er
foretaget et antal (n) målinger (t1 , y1 ), . . . , (tn , yn ) og vi vil ud fra disse målinger bestemme en
ligning y = pt + q for den rette linje, der afviger mindst fra målingerne.
Hvordan skal vi beskrive afvigelsen mellem en linje og en række målinger? Dertil beregnes for
hver måling (ti , yi ) afvigelsen pti + q − yi mellem den målte værdi yi og den beregnede værdi
pti + q. Som et mål for denne afvigelse benyttes kvadratet ( pti + q − yi )2 og vi er interesserede
i at bestemme værdier for p og q sådan at summen af alle disse kvadratafvigelser
n
Q( p, q) =
∑ ( pti + q − yi )2
i =1
er så lille som muligt. Metoden illustreres i nedenstående eksempel. Se [4].
Eksempel 2.1 I et forsøg undersøges en mulig sammenhæng mellem luftfugtigheden L (målt i %) og
udklækningstiden U (målt i timer) for en type flueæg. Data findes i tabellen neden for.
L
U
100
16.6
94
17.4
88
18.3
82
18.2
76
19.6
70
20.2
64
21.7
58
22.0
52
22.7
46
23.2
Maple har funktionalitet der dækker lineær regression.
with(Statistics);
ler := [100, 94, 88, 82, 76, 70, 64, 58, 52, 46];
uer := [16.6, 17.4, 18.3, 18.2, 19.6, 20.2, 21.7, 22.0, 22.7, 23.2];
line := LinearFit([1, t], ler, uer, t);
luer := [seq([ler[k], uer[k]], k = 1 .. 10)];
plot(luer, style = point, symbol = asterisk, color = black,
labels = [Udklækningstid(L), Luftfugtighed(U)],
labeldirections = [horizontal, vertical]);
plu := %
plot(line, t = 40 .. 100); pline := %;
with(plots);
display([plu, pline]);
Køres disse linjer i Maple findes regressionslinjen til U = 29.29 − 0.13L, og det svarer til p = −0.13
og q = 29.29. Figur 1 viser resultatet af display([plu, pline]);
2
Figur 1: Målepunkter og linjen U = 29.29 − 0.13L
Som det ses beskrives data meget godt af en ret linje. Den centrale kommandolinje i Maple ovenfor er
kaldet LinearFit, der bevirker, at parametrene p og q beregnes. (Bemærk, at kaldet, der starter med
plot(luer af typesætningshensyn er delt to steder.)
Det viser sig, at de bedste værdier af p og q faktisk kan bestemmes som løsningen til to ligninger med to
ubekendte, som kan formuleres vha. matricer og vektorer. Vi vil dog ikke gå nærmere ind i disse detaljer. I
stedet for vil vi bruge Maple til at visualisere sammennhængen mellem forskellige værdier af parametrene
p og q og den tilsvarende afvigelse Q( p, q). Det kan gøres ved at plotte Q( p, q) som en funkton af to
variable:
with(plots):
Q := (p,q)->sum((p*ler[j]+q-uer[j])^2, j = 1 .. 10);
plot3d(Q(p,q), p=-0.5..0.5, q=10..50, axes=framed);
Resultatet af disse linjer ses i Figur 2.
I ovenstående eksempel lå data pænt omkring en ret linje. Ofte er man i den situation, hvor
man slet ikke forventer, at der kunne tænkes en lineær sammenhæng i data. Det kunne være
modeller for radioaktivt henfald, hvor ændringen af et stofs koncentration naturligt er proportional med stoffets koncentration. I Eksempel 2.2 (se [4]) giver vi et andet eksempel på en ikke
lineær samenhæng mellem pattedyrs kropsvægt og stofskifte.
3
Figur 2: Illustration af Q( p, q)
Eksempel 2.2 I tabellen neden for er angivet samhørende målinger af forskellige pattedyrs kropsvægt
(målt i kg) og stofskifte (målt i antal liter ilt forbrændt pr. time).
Dyr
Kropsvægt, K
Stofskifte, S
Vampyrflagermus
0.029
0.027
Næsebjørn
3.9
1.0
Ørkenræv
1.1
0.4
Hyæne
Kænguru
Jordsvin
7.0
2.2
33
5.8
48
6.0
Plottes disse målinger i et KS-koordinatsystem ses det, at data kun dårligt ville kunne beskrives ved en
lineær sammenhæng. Det viser sig, at en potenssammenhæng langt bedre beskriver data.
Vi vil nu bestemme parametrene a og b således at funktionen f (K ) = bK a kan siges at beskrive data
“bedst muligt”.
Dette problem kan angribes på flere forskellige måder.
i Ofte vælger man at transformere data så man har at gøre med et lineært problem. Antages f (K ) =
bK a finder vi ln f (K ) = ln b + a ln K. Derfor beskriver f (K ) sammenhængen mellem K og S netop
hvis
ln f (K ) = ln b + a ln K
beskriver den lineære sammenhæng mellem ln K og ln S. Vi kan da transformere data ved at tage
logaritmen til både kropsvægten og stofskiftet og plotte disse punkter. Dette er gjort i Figur 3. Den
rette linje, som bedst beskriver data har ligningen (der er afrundet til to decimaler)
ln f (K ) = −0.94 + 0.75 ln K.
4
Figur 3: Transformerede data (ln K, ln S) og den bedste rette linje
Det ses, at denne linje tilnærmer de transformerede punkter godt og derfor vil vi forvente en potenssammenhæng i data. Ordet “godt” kræver noget forklaring, som involverer modelcheck og som vi
udskyder til senere i uddannelsen. Transformeres tilbage kan vi dermed sige, at potensfunktionen
f (K ) = e−0.94+0.75 ln K = 0.39K0.75
bedst beskriver data.
ii “Back to basics”. Vi kan opskrive den tilsvarende sum af afvigelser Q( a, b) mellem f (K ) = bK a
og de ikke transformerede datapunkter. Denne sum af afvigelser betragtes som en funktion af de to
parametre og minimum for denne funktion bestemmes. Det er der to ting at sige til: For det første
kendes de matematiske metoder til at bestemme minimum for funktioner af to variable endnu ikke.
For det andet, selv når disse metoder kendes, er det en teknisk overvældende opgave at bestemme
minimum “i hånden” når blot datamængderne som her er bare lidt store. Funktionen er i dette
eksempel
6
Q( a, b) =
∑
S j − bK ja
2
,
j =1
hvor punkterne (K j , S j ) er angivet i tabelen oven for.
iii Bruge en mere avanceret “ikke lineær regression” på data. Basalt set er dette en implementering af
metoden “Back to basics”. Maple indeholder et udvalg af sådane rutiner. Med notationen oven fra
skrives
5
with(Statistics);
with(plots);
ker := [0.029, 1.1, 3.9, 7.0, 33, 48];
ser := [0.027, 0.4, 1.0, 2.2, 5.8, 6.0];
Fit(b*t^a, ker, ser, t);
Resultatet er, at a = 0.61 og b = 0.61, således, at den potensfunktion, der ligger tættest på punkterne f (K ) = 0.61 K0.61 .
iv Vi har altså to forskellige potensfunktioner, 0.61K0.761 og 0.39K0.75 , som begge kunne siges at
beskrive data bedst muligt. Som nævnt vil man ofte foretrække funktionen
f (K ) = 0.39K0.75 ,
fordi denne viser en lineær sammenhæng i det transformerede data. Det skal bemærkes, at parametrene a = 0.75 og b = 0.39 ikke minimerer funktionen
6
Q( a, b) =
∑
S j − bK ja
2
.
j =1
(Det gør derimod a = 0.61 og b = 0.61.) Derimod minimerer a = 0.75 og b = 0.39 funktionen
6
( a, b) →
∑
ln S j − ln b − a ln K j
2
.
j =1
v Ved at foretage en anden transformation af data fra Eksempel 2.2 kunne man undersøge en eventuel
eksponentiel sammenhæng i data: antages, at f (K ) = baK har vi ln f (K ) = ln b + K ln a hvorved
vi ville forvente at de transformerede punkter (K, ln S) ville tilnærmes godt af en ret linje. Det er
ikke tilfældet.
vi Inden for statistik er Maple iøvrigt ikke så udbredt som fx R-systemet. Det introduceres senere i
uddannelsen.
Bemærkning 2.1 Det er muligt at se lidt med, når Maple finder svarene til de opgaver man giver.
Dette gøres ved infolevel og skrives
infolevel[all] := 5;
Fit(b*t^a, ker, ser, t);
infolevel[all] := 0;
viser output, at Maple bruger NonlinearFit og LSSolve. Kort forklaret finder Maple først ud af, at der
skal anvendes en ikke linæer kurvetilpasning og dernæst metoden “Least Squares Solve”.
6
3
3.1
Modellering af hormesis
Hvad er hormesis?
Hormesis kan beskrives som et fænomen, hvor en lille dosis af “gift” eller anden form for biologisk stress til et biologisk system faktisk ikke er skadeligt for systemet men tværtimod kan være
gavnligt. Systemets respons på små doser er positiv, mens responsen på større doser er negativ.
Forskere er uenige om hvor udbredt og vigtigt fænomenet er. Fænomenet er formuleret relativt
bredt, som det fremgår nedenfor. Det turde også fremgå, at fænomenet i visse forklædninger
er ret kontroversielt.
• Indtagelse af små mængder alkohol kan have en positiv effekt på kredsløbet, mens indtagelse af større doser ikke har nogen gavnlig fysisk effekt!
• Strålingshormesis. Dette er en tese om, at små (vedvarende) doser af ioniserende stråling
er gavnlig for organismen. Den lave stråling kan stimulere organismens “reparationsmekanismer”, som derved kan beskytte mod forskellige former for sygdom. Laboratorieforsøg synes at bekræfte dette, men det har ikke været muligt at underbyggge teorien
med tilstrækkeligt data, og man opererer derfor generelt ikke med hormesis i forbindelse
med stråling.
Det kan nævnes, at byggematerialerne i forskellige boligblokke i Taiwan uoverlagt indeholdt den radioaktive isotop Cobolt-60. Undersøgelser viste imidlertid, at cancerdødsrater var meget mindre end i befolkningen generelt. Utroligt! og også temmeligt usandsynligt! Undersøgelserne tog nemlig ikke i betragtning, at beboerene i boligblokken
var relativt unge sammenlignet med Taiwans befolkning generelt. Faktisk viser senere
undersøgelser en signifikant vækst i fx leukæmi.
Neden for skal vi beskæftige os med hormesis inden for økotoksikologi. Pointen er ikke et
korstog for eller imod hormesis, men snarere at forsøge at beskrive forskellige modeller for
dosis-respons. Disse modeller indeholder parameter, der kan beskrive en hormetisk effekt, men
også kan udtale sig om hvorvidt en hormetisk effekt er signifikant. Vi giver en ramme for senere
at kunne undersøge, vha statistiske metoder, hvornår der synes at være noget i data, der tyder
på hormesis.
3.2
Økotoksikologi. Matematiske modeller
Inden for økotoksikologi undersøges fx planters respons når de udsættes for doser af forskellige toksiner. Man kan fx observere sammenhængen mellem koncentration af tilsat toksin og
bladlængde i en bestemt type plante.
For nogle kombinationer af planter og toksiner genkendes dosis-responskurverne som “logistiske” kurver af formen
d−c
y( x ) = c +
.
1 + eb(ln x−ln g)
7
Figur 4: En dosis-respons kurve
(Faktisk er disse kurver sammensætningen af den naturlige logaritme og en logistisk funktion
med bærekapacitet d − c og vækstrate −b.) Disse funktioner er aftagende og det illustrerer, at
større dosis medfører mindre respons. For andre kombinationer synes logistiske kurver ikke at
kunne beskrive sammenhængen mellem dosis og respons. Se bare på Figur 4, hvor responsen
af Cucumis sativus er studeret ved forskellige doser af toksinet parthenin.
Inden for Risk-management er man interesseret i niveauer, hvor p % af forskellen mellem kontrolresponsen (uden tilsætning af toksin) og den asymptotiske respons (tilsætning af meget
store doser toksin) er opnået. Disse niveauer kaldes EDp-niveauer og særligt ED50-niveauet
tjener som rettesnor for hvor meget toksin man kan nøjes med at give. I en kompleks situation, hvor flere toksiner og planter spiller sammen kan man måske komme ud for at et ED50
niveau for en plante bevirker en hormetisk effekt for andre planter og det kan være vanskeligt
at afgøre om det er optimalt at holde sig til ED50-niveauet. Bl.a. derfor er det vigtigt at kunne
afsløre hormetisk effekt.
En modificeret logistisk model, som tager højde for hormesis blev introduceret af Brain og
Cousens i 1989 (se [2]). Modellen er en responskurve af formen
y( x ) = c +
d−c+ fx
,
1 + eb(ln x−ln g)
som kun afviger fra en logistisk model ved inklusion af parameteren f .
Sætning 3.1 (Brain og Cousens model) Lad b, c, d, f og g være positive parametre og antag at b > 1
samt at d > c. Funktionen
d−c+ fx
, x>0
y( x ) = c +
1 + eb(ln x−ln g)
vokser fra værdien
lim y( x ) = d
x →0+
til et maksimum, hvorefter den aftager mod værdien
lim y( x ) = c.
x →∞
Set fra en statistisk vinkel kan denne model nogle gange være problematisk, idet et estimat
af parameteren f i visse tilfælde er negativt. Man kan vise, at den kurve der bedst beskriver
8
data da har en dal og ikke en top ved lave doser. Det er muligt at foretage parameterestimater
under antagelse af, at f er ikke-negativ, men det er ikke altid sket. Tilsvarende, hvis b er mindre
end 1 så beskriver kurven på ingen måde en dosis-respons kurve, og her vil estimater under
antagelsen b > 1 være nødvendige. Antagelser om både f og b kan lede til en mindre robust
model. Brain og Cousens model kan dog ofte bruges og den indgår i studier af hormesis i
blandinger, se fx [1]. Modellen er matematisk set relativt simpel, hvilket gør den nemmere at
bruge.
Cedergren, Ritz og Streibig (se [3]) har introduceret en mere robust, men også mere kompliceret
model for dosis-respons kurver. En af pointerne i dette skrift er at undersøge denne model.
Definition 3.1 (Cedergreen, Ritz og Streibig’s model) For positive parametre a, b og g defineres
−a
y( x ) = c +
−a
d − c + f e− x
d − c + f e− x
=
c
+
.
1 + ( x/g)b
1 + eb(ln x−ln g)
(De øvrige parametre er reelle.)
Forelagt data for en specifik plante og en specifik gift er det muligt statistisk at teste om parameteren f kunne være lig med 0. Lidt mere præcist testes det, hvor sandsynligt det ud fra data
er at f er forskellig fra 0. Man taler om, at parameteren f er signifikant (har en betydning).
Statistiske tests baseret på denne eller Brain og Cousens model et redskab for at afgøre om
hormesis optræder.
3.3
Egenskaber ved modelfunktionen. Parametrenes rolle
I dette afsnit undersøges hvordan de forskellige parametre påvirker responsfunktionen. Maple
bruges til at visualisere og hjælpe med (symbolske) beregninger. Funktionen er (som i Definition 3.1)
−a
−a
d − c + f e− x
d − c + f e− x
y( x ) = c +
=
c
+
,
1 + ( x/g)b
1 + eb(ln x−ln g)
hvor a, b og g antages positive. Vi noterer følgende simple egenskaber:
i Der gælder, at
lim y( x ) = d.
x →0
Parameteren d beskriver altså kontrolresponsen.
ii Tilsvarende repræsenterer parameteren c den asymptotiske respons (altså responsen ved
meget høje doser), idet der gælder
lim y( x ) = c.
x →∞
I den videre analyse vil vi antage, at der gælder d ≥ c, altså, at der for store doser er en toksisk
virkning. De øvrige parametre afspejler også egenskaber ved kurven, omend sammenhængen
mellem parametre og egenskaber ikke er helt simpel.
9
iii Antages, at f er positiv gælder der, at summen af parametrene d og f er en øvre grænse
−α
for den maksimale hormetiske effekt: Faktisk har vi e− x ≤ 1 og da eb(ln x−ln g) > 0 gælder
dermed
−a
y( x ) = c +
d − c + f e− x
d−c+ f
≤ c+
≤ c + d − c + f = d + f.
1 + eb(ln x−ln g)
1 + eb(ln x−ln g)
Det er vigtigt at pointere, at der er tale om en øvre grænse. Maksimum for funktionen y
kan i princippet udtrykkes vha alle de ingående parametre, men udregningerne bliver
hurtigt umulige: Den afledede kan udregnes vha Maple:
dr := x -> c+(d-c+f*exp(-1/x^a))/(1+exp(b*(ln(x)-ln(g))))
diff(dr(x),x)
Resultatet er
−a
y0 ( x ) =
x a +1
−a
f ae− x
(d − c + f e−x )beb(ln x−ln g)
−
.
2
1 + eb(ln x−ln g)
x 1 + eb(ln x−ln g)
iv Størrelsen af b har bl.a. betydning for hvor hastigt kurven aftager efter den maksimale
hormetiske effekt. Størrelsen af a har betydning for hvornår den maksimale hormetiske
effekt opnås. Se Opgave C.
Man kunne ledes til at tro, at funktionen i lighed med Brain og Cousens funktion vokser fra
værdien i x = 0 mod et maksimum, hvorefter den aftager mod grænseværdien for x gående
mod uendeligt. Dette er imidlertid ikke tilfældet, idet der gælder
lim y0 ( x ) x1−b = −(d − c)be−b ln g < 0.
x →0+
Heraf følger, at y( x ) er en aftagende funktion for x tæt på 0. Denne egenskab kunne synes at
være uheldig, men oftest er der slet ikke data ekstremt tæt på x = 0, og faktisk synes noget af
det data, der er tilgængeligt at “bekræfte” denne tendens.
Man kan endvidere vise, at y( x ) er aftagende for alle tilstrækkeligt store værdier af x. Disse
resultater udnytter størrelsesorden af eksponentialfunktioner og potensfunktioner; se Opgave
F.
3.4
Undersøgelse af EDp-niveauer
Et EDp-niveau er en dosis hvor p % af forskellen d − c mellem kontrolresponsen og den asymptotiske respons er opnået. Et sådant niveau x = EDp skal altså opfylde
−a
d − c + f e− x
p c+
=
c
+
1
−
.
100
1 + eb(ln x−ln g)
EDp-niveauer er interessante for koncentrationer, som er større end hvor den maksimale hormetiske effekt opnås. Til højre for maksimumspunktet for y er y en aftagende funktion og dette
sikrer, at der for hvert p er netop et tilhørende niveau EDp.
10
Figur 5: Dosis-respons med logaritmisk førsteakse. Parameterværdierne i Definition 3.1 er a =
0.25, b = 0.48, c = 0, d = 11, f = 416 og g = 0.014
Parameteren g er en nedre grænse for ED50 niveuaet, hvis f ≥ 0. Det betyder, at y( g) >
(c + d)/2, som indses på følgende måde:
−a
y( g) = c +
d − c + f e− g
d − c + f e− g
=
c
+
2
1 + eb(ln g−ln g)
−a
> c+
d−c
c+d
=
.
2
2
Til numerisk bestemmelse af EDp-niveauer anvendes generelle metoder for nulpunktsbestemmelse, som fx bisektionsmetoden, hvor et interval successivt midterdeles alt efter funktionens
(forskellige) fortegn i endepunkterne af intervallet.
3.5
Dosis-respons-grafik
Man ser, at x-aksen på den viste graf fra artiklen af Cedergreen, Ritz og Streibig er anderledes
end sædvanligt: aksen er logaritmisk. Se Figur 5. Data er observeret ved forskellige koncentrationer, hvor forholdet mellem en given koncentration og den næste er 10. Maple har indbygget
mulighed for at angive, at man ønsker en eller begge akser angivet i logaritmisk skala. Fx giver
følgende kode grafen for titalslogaritmen i Figur 6.
plot([log[10](x)], x=1..100, axis[1]=[mode=log, tickmarks=[1, 10, 100]])
3.6
Statistisk analyse af kurverne
I dette afsnit vil vi undersøge, hvordan Maple fungerer med kurvetilpasning og modellen af
Cedergren, Ritz og Streibig. Det er ikke altid, at Maple er lige pålidelig og det giver anledning
til implementering af en mere stabil og specialiseret rutine der kan fitte en generel klasse af
dosis-responskurver. En sådan rutine er udviklet af Ritz og Streibig, ikke til Maple men til R.
Se www.r-project.org under “Packages” og “drc”. Se endvidere www.bioassay.dk.
11
Figur 6: Et plot af titalslogaritmen med logaritmisk førsteakse
Dosis-responskurverne indeholder mange parametre. For at undgå overparametrisering foreslår Cedergreen, Ritz og Streibig, at parameteren a sættes til 0.25, 0.5 eller 1.0 alt efter hvonår en
mulig hormetisk effkt ser ud til at optræde.
4
Indlæsning af data i Maple
Her beskrives kort, hvilke (simple) muligheder Maple har i forbindelse med indlæsning af data
fra en fil. Der er også mere avancerede muligheder, der byder på større fleksibilitet mht format,
men dem vil vi forsøge at undgå.
• ImportMatrix. Filnavnet angives som en tekststreng ("filnavn") med angivelse af den
præcise placering af filen. Der er en række options, såsom overspringelse af linjer, angivelse af skilletegn og hvilken datatype der sal indlæses i. Eksempel:
ImportMatrix("/home/henrikp/undervisning/natit/byg.csv",
source = delimited, delimiter = ",", datatype = float[4], skiplines = 1)
• ImportData()– uden parametre. Her bliver man ført gennem en guide “Data Import Assistant”, hvorved man kan bestemme format osv.
• readdata Her indlæses data i søjler adskilt af blanktegn. Eksempel:
readdata("/home/henrikp/undervisning/natit/blanding.txt", [integer,
string, float, float])
12
5
Opgaver
A I filen byg.csv (findes på kursushjemmesiden) findes observerede data hvor en bygsort
Hordeum vulgare udsættes for herbicidet metsulfuron-methyl i forskellige doser. Responsen
måles i bladlængden i cm og herbicidet måles i µg/L.
(a) Undersøg indholdet i filen byg.csv fra kursushjemmesiden og download den.
(b) Indlæs data fra byg.csv i Maple fx vha
data := ImportMatrix("byg.csv", source = delimited,
delimiter = ",", datatype = float[4], skiplines = 1)
data er dermed en matrix (talskema) med 42 rækker og 2 søjler (skiplines bevirker, at der ses bort fra første linje i filen, der indeholder navnene på data). Brug evt
?ImportMatrix.
Check, at data er korrekt indlæst ved fx at skrive seq(data[k,1],k=1..42).
(c) Plot punkterne i et almindeligt xy-koordinatsystem (med plot(data, style=point)).
Kan man tydeligt se alle punkter?
(d) Bestem vha lineær regression den rette linje, der ligger tættest på punkterne. [Vink:
brug LinearFit.]
Bestem endvidere den logistiske funktion af formen
y ( x ) = a1 +
a2
,
1 + a 3 x a4
som bedst beskriver sammenhængen i data. [Vink: brug Fit]
Indtegn endeligt punkterne og de to regressionskurver i et koordinatsystem, hvor xaksen er logaritmisk. Kommentér denne graf. Hvor godt beskriver kurverne data?
(e) Plot datapunkterne igen som punkter i et nyt koordinatsystem, hvor x-aksen er logaritmisk.
Plot endvidere
−0.25
d − c + f e− x
y( x ) = c +
1 + eb(ln x−ln g)
i samme koordinatsystem for forskellige værdier af parametrene, og overbevis dig selv
om, at det ikke er lige til at finde de bedst mulige parametre. [Vink: brug eventuelt
numpoints=1000 i plottet for at få en mere glat kurve.]
(De optimale parameterværdier for a = 0.25 er b = 0.48, c = 0, d = 11, f = 416 og
g = 0.014.)
B Betragt funktionen
−a
d − c + f e− x
1 + eb(ln x−ln g)
med parameterværdierne a = 0.25, b = 0.48, c = 0, d = 11, f = 416 og g = 0.014. Lav
en funktionsundersøgelse af denne funktion vha Maple og bestem intervaller hvor funktionen aftager og intervaller hvor den vokser. [Vink: Det kan være nødvendigt med en meget
detaljeret graf tæt ved x = 0. Brug eventuelt også mode=log og fx numpoints=1000.]
y( x ) = c +
13
Bestem envidere ED50-niveauet for denne funktion. [Vink: fsolve.]
C I denne opgave undersøges, hvordan a og b indvirker på opførslen af grafen for y( x ) i Definition 3.1.
(a) Lad b = 2, c = 0, d = 1, g = 10 og f = 1. Undersøg vha Maple, hvad der ser ud til
at ske med den dosis, der resulterer i maksimal respons når a vokser. [Forslag: plot for
forskellige værdier af a i samme koordinatsystem; lav eventuelt en animation.]
(b) Lad a = 1, c = 0, d = 1, g = 10 og f = 1. Undersøg vha Maple, hvad der ser ud til at
ske med kurvens hældning efter maksimumsdosis med stigende b.
D Antag, at alle parametre er positive. Vis at y( x ) fra Definition 3.1 opfylder
c+
d−c
d−c+ f
≤ y( x ) ≤ c +
,
b
(
ln
x
−
ln
g
)
1+e
1 + eb(ln x−ln g)
og slut heraf, at kurven ligger mellem to logistiske kurver (som beskrevet i Afsnit 3.2).
E Lad nu a = 1, b = 2, c = 0, d = 1 og g = 1, men lad f være ukendt. Vis vha Maple, at
grafen for y( x ) i Definition 3.1 har en top for f = 10, er logistisk for f = 0 og har en dal for
f = −10.
F Eftervis, at y( x ) i Definition 3.1 er aftagende for alle x nær nul hvis der gælder d − c > 0 og
for alle tilstrækkeligt store x hvis der gælder d − c + f > 0.
G Bevis Sætning 3.1.
Litteratur
[1] R. G. Belz, N. Cedergreen and H. Sørensen, Hormesis in Mixtures - Can it be predicted?,
Science of the total Environment 404: 77–87, 2008.
[2] P. Brain and R. Cousens, An equation to describe dosis-responses where there is stimulation of
growth at low doses, Weed Res 29: 93–96, 1989.
[3] N. Cedergreen, C. Ritz and J.C. Streibig, Improved Empirical Models Describing Hormesis,
Environmental Toxicology and Chemistry 24: 3166–3172, 2005.
[4] T. V. Pedersen og H. L. Pedersen, Matematik og databehandling: Noter om matematik, Academic books, 2008.
14