Tilastollinen vastepintamallinnus Robert Piche´ TTY Tilastollinen vastepintamallinnus – p. 1/16 Kokeisiin perustuva optimointi Miten optimoida tuote tai prosessi: seulonta: kokeet → regressio → faktorin tarpeellisuus x2 //, x3 x4 , //) x5 + ǫ y = f (x1 , //, parannussuunta: 1. kertaluvun regressiomalli ¨ a¨ ariarvo: 2. kertaluvun regressiomalli 2 87 90 90 70 65 x2 65 60 96 70 X 0 2 65 60 55 60 55 50 30 55 70 x1 93 1 75 90 -1 -2 -2 -1 0 1 2 X 1 Tilastollinen vastepintamallinnus – p. 2/16 Kemiallisen prosessin optimointi vaste: suhteellinen puhtaus y % maksimoitava ¨ x1 ∈ [60, 150], x2 ≥ 0 tekijat: koesuunnittelu: 90 2 täydellinen 2k -koe x 30 70 x 90 1 tulokset: x1 x2 y 90 70 90 70 90 70 70 90 90 90 90 90 30 30 30 30 77.8 69.4 73.1 65.7 57.3 48.1 49.8 52.3 Tilastollinen vastepintamallinnus – p. 3/16 Empirinen malli koodaus: X1 = (x1 − 80)/10, X2 = (x2 − 60)/30 malli: y = β0 + β1 X1 + β2 X2 + ǫ regressio: (Matlab statistics toolbox) >> >> >> >> >> X1 = [ 1;-1; 1;-1; 1;-1;-1; 1]; X2 = [ 1; 1; 1; 1;-1;-1;-1;-1]; y = [77.8;69.4;73.1;65.7;57.3;48.1;49.8;52.3]; D = [ones(8,1) X1 X2]; b = regress(y,D) b = 61.6875 3.4375 9.8125 Tilastollinen vastepintamallinnus – p. 4/16 Regression tunnuslukuja >> [b,bint,r,rint,stats] = regress(y,X); >> stats stats = 0.9622 63.7086 0.0003 6.7872 eli R2 = 0.96 ja hypoteesin β1 = β2 = 0 merkitsevyys on 0.0003. Parametriestimaattien 95% luottamusvälit ovat >> bint bint = 59.3198 1.0698 7.4448 64.0552 5.8052 12.1802 Tilastollinen vastepintamallinnus – p. 5/16 Gradienttimenetelmä ¨ etsintapolku: X1 X2 x 150 2 30 65 55 = b1 b2 x1 85.3 90.6 95.9 101.2 210 90 ! 70 60 ! ∆i (i = 1, 2, . . .) x2 105 150 195 240 y 74.3 83.2 84.7 ← polun optimi 80.1 50 70 90 x1 110 Sitten suoritetaan koesarja pisteen (95.9, 195) ympärillä . . . Toistetaan kunnes 1. kertaluvun malli ei enää sovi. Tilastollinen vastepintamallinnus – p. 6/16 1. kertaluvun malli lähellä ääriarvoa >> >> >> >> >> >> X1 = [-1; 0;-1; 1; 1; 0]; X2 = [-1; 0; 1;-1; 1; 0]; y = [93.6;96.2;91.7;92.5;92.9;97.0]; D = [ones(6,1) X1 X2]; [b,bint] = regress(y,D); bint bint = 90.4504 -4.3020 -4.7020 97.5163 4.3520 3.9520 Tässä β1 , β2 voisivat hyvinkin olla nolla. Kaarevuus paljastuu myös testaamalla epäsopivuus (LOF ). Tilastollinen vastepintamallinnus – p. 7/16 Toisen kertaluvun malli malli: y = β0 + β1 X1 + β2 X2 + β11 X12 + β22 X22 + β12 X1 X2 + ǫ koesuunnittelu: CCD-koe = 2k -koe + aksiaaliosa + keskusosa X2 X1 a - koe on kiertosymmetrinen jos a = - 3–8 koetoistoa origossa √ 2 Tilastollinen vastepintamallinnus – p. 8/16 2. kertaluvun mallin sovitus >> >> >> >> >> a = sqrt(2); X1 = [X1;-a;a;0;0]; X2 = [X2;0;0;-a;a]; y = [y;92.7;92.8;93.4;92.7]; D = [ones(10,1) X1 X2 X1.ˆ2 X2.ˆ2 X1.*X2]; b = regress(y,D) b = 96.6000 0.0302 -0.3112 -1.9812 -1.8312 0.5750 eli yˆ = 96.60 + 0.03X1 − 0.31X2 − 1.98X12 − 1.83X22 + 0.58X1 X2 Tilastollinen vastepintamallinnus – p. 9/16 Kriittinen piste ja sen laatu T b + dT Ed, 2. kertaluvun malli: y ˆ (d) = b + d 0 ! ! missä d = x1 x2 ,b= b1 b2 , ja E = b11 1 2 b12 1 2 b12 b22 ! gradientti: ∂ yˆ/∂d = b + 2Ed kriittinen piste: d = − 12 E−1 b =: z Schurin hajotelma: E = QΛQT kanoninen muoto: Jos QT (d − z) =: e, niin yˆ(d) = yˆ(z) + (d − z)T E(d − z) = yˆ(z) + eT Λe X = yˆ(z) + λi e2i i Tilastollinen vastepintamallinnus – p. 10/16 Kemiallisen prosessin kriittinen piste vastepinta: yˆ(d) = 96.60 + 0.03X1 − 0.31X2 − 1.98X12 − 1.83X22 + 0.58X1 X2 ! ! 0.03 −1.98 0.29 T T = 96.60 + d +d d −0.31 0.29 −1.83 kriittinen piste: z= − 12 −1.98 0.29 0.29 −1.83 !−1 0.03 −0.31 ! = 0.00 −0.09 ! ennustettu ääriarvo: yˆ(z) = 96.61 Tilastollinen vastepintamallinnus – p. 11/16 Kemiallisen prosessin ääriarvon laatu >> [Q,Lambda]=schur([-1.98 .29;.29 -1.83]) Q = 2 -0.7907 0.6122 87 -0.6122 -0.7907 90 93 1 96 X2 Lambda = -2.2045 0 0 -1.6055 0 -1 -2 -2 Kriittinen piste on maksimi. ← -1 0 1 2 X1 Vastepinta on vähän kaarevampi Q:n ensimmäisen sarakkeen suuntaan. Tilastollinen vastepintamallinnus – p. 12/16 Harjuanalyysi Jos E ei ole definiitti tai jos kriittinen piste on kaukana, etsitään ääriarvo ympyrässä Cd0 ,∆i := {d | kd − d0 k = ∆i }. harju: satula: Tilastollinen vastepintamallinnus – p. 13/16 Harjuanalyysin lause Jos µ > max{λ1 , . . . , λk }, niin E − µI on negatiividefiniitti ja di := d0 + (E − µI) −1 1 (− b − Ed0 ) 2 on ainoa yˆ(d):n maksimoija joukossa Cd0 ,kdi −d0 k . Todistus: Jos kd − d0 k = kdi − d0 k, niin yˆ(d) − yˆ(di ) = (b + 2Edi )T (d − di ) + (d − di )T E(d − di ) = (d − di )T (E − µI)(d − di ) + (µd − µdi + b + 2Edi )T (d − di ) | {z } µ(kd−d0 k2 −kdi −d0 k2 ) = (d − di )T (E − µI)(d − di ) Tilastollinen vastepintamallinnus – p. 14/16 Harjuanalyysikaavan käyttö 1. Valitse sellainen µi , että µi > max{λ1 , . . . , λk }. 2. Laske di = d0 + (E − µi I) −1 1 (− b − Ed0 ) 2 ∆i = kdi − d0 k yˆ(di ) = b0 + dTi b + dTi Edi 3. Toista askeleet 1–2 kunnes di on sopivan kaukana lähtöpisteestä d0 . 4. Suorita koesarja pisteen di ympärillä ja tee uusi vastepinta. Tilastollinen vastepintamallinnus – p. 15/16 Yhteenveto Vastepintamallinnu= koesuunnittelu + regressio + optimointi suora vastepinta: 2k -koe + 1. kertaluvun regressiomalli + etsintä gradientin suuntaan kaareva vastepinta: CCD-koe + 2. kertaluvun regressiomalli + ääriarvo tai harjuanalyysi Lisää tietoa: Piché, Ruohonen (2003): Tilastollinen vastepintamallinnus math.tut.fi/˜piche/TKS/pruju.html Buyske (2001): Advanced Design of Experiments www.stat.rutgers.edu/˜buyske/591/lect_all.pdf Tilastollinen vastepintamallinnus – p. 16/16
© Copyright 2024