Tilastollinen vastepintamallinnus

Tilastollinen vastepintamallinnus
Robert Piche´
TTY
Tilastollinen vastepintamallinnus – p. 1/16
Kokeisiin perustuva optimointi
Miten optimoida tuote tai prosessi:
seulonta: kokeet → regressio → faktorin tarpeellisuus
x2 //,
x3 x4 , //)
x5 + ǫ
y = f (x1 , //,
parannussuunta: 1. kertaluvun regressiomalli
¨
a¨ ariarvo:
2. kertaluvun regressiomalli
2
87
90
90
70
65
x2
65
60
96
70
X 0
2
65
60
55
60
55
50
30
55
70
x1
93
1
75
90
-1
-2
-2
-1
0
1
2
X
1
Tilastollinen vastepintamallinnus – p. 2/16
Kemiallisen prosessin optimointi
vaste: suhteellinen puhtaus y % maksimoitava
¨ x1 ∈ [60, 150], x2 ≥ 0
tekijat:
koesuunnittelu:
90
2
täydellinen 2k -koe
x
30
70
x
90
1
tulokset:
x1
x2
y
90
70
90
70
90
70
70
90
90
90
90
90
30
30
30
30
77.8 69.4 73.1 65.7 57.3 48.1 49.8 52.3
Tilastollinen vastepintamallinnus – p. 3/16
Empirinen malli
koodaus: X1 = (x1 − 80)/10, X2 = (x2 − 60)/30
malli: y = β0 + β1 X1 + β2 X2 + ǫ
regressio: (Matlab statistics toolbox)
>>
>>
>>
>>
>>
X1 = [ 1;-1; 1;-1; 1;-1;-1; 1];
X2 = [ 1; 1; 1; 1;-1;-1;-1;-1];
y = [77.8;69.4;73.1;65.7;57.3;48.1;49.8;52.3];
D = [ones(8,1) X1 X2];
b = regress(y,D)
b =
61.6875
3.4375
9.8125
Tilastollinen vastepintamallinnus – p. 4/16
Regression tunnuslukuja
>> [b,bint,r,rint,stats] = regress(y,X);
>> stats
stats =
0.9622
63.7086
0.0003
6.7872
eli R2 = 0.96
ja hypoteesin β1 = β2 = 0 merkitsevyys on 0.0003.
Parametriestimaattien 95% luottamusvälit ovat
>> bint
bint =
59.3198
1.0698
7.4448
64.0552
5.8052
12.1802
Tilastollinen vastepintamallinnus – p. 5/16
Gradienttimenetelmä
¨
etsintapolku:
X1
X2
x 150
2
30
65
55
=
b1
b2
x1
85.3
90.6
95.9
101.2
210
90
!
70
60
!
∆i
(i = 1, 2, . . .)
x2
105
150
195
240
y
74.3
83.2
84.7 ← polun optimi
80.1
50
70
90
x1
110
Sitten suoritetaan koesarja pisteen (95.9, 195) ympärillä . . .
Toistetaan kunnes 1. kertaluvun malli ei enää sovi.
Tilastollinen vastepintamallinnus – p. 6/16
1. kertaluvun malli lähellä ääriarvoa
>>
>>
>>
>>
>>
>>
X1 = [-1; 0;-1; 1; 1; 0];
X2 = [-1; 0; 1;-1; 1; 0];
y = [93.6;96.2;91.7;92.5;92.9;97.0];
D = [ones(6,1) X1 X2];
[b,bint] = regress(y,D);
bint
bint =
90.4504
-4.3020
-4.7020
97.5163
4.3520
3.9520
Tässä β1 , β2 voisivat hyvinkin olla nolla.
Kaarevuus paljastuu myös testaamalla epäsopivuus (LOF ).
Tilastollinen vastepintamallinnus – p. 7/16
Toisen kertaluvun malli
malli: y = β0 + β1 X1 + β2 X2 + β11 X12 + β22 X22 + β12 X1 X2 + ǫ
koesuunnittelu:
CCD-koe = 2k -koe + aksiaaliosa + keskusosa
X2
X1
a
- koe on kiertosymmetrinen jos a =
- 3–8 koetoistoa origossa
√
2
Tilastollinen vastepintamallinnus – p. 8/16
2. kertaluvun mallin sovitus
>>
>>
>>
>>
>>
a = sqrt(2);
X1 = [X1;-a;a;0;0]; X2 = [X2;0;0;-a;a];
y = [y;92.7;92.8;93.4;92.7];
D = [ones(10,1) X1 X2 X1.ˆ2 X2.ˆ2 X1.*X2];
b = regress(y,D)
b =
96.6000
0.0302
-0.3112
-1.9812
-1.8312
0.5750
eli yˆ = 96.60 + 0.03X1 − 0.31X2 − 1.98X12 − 1.83X22 + 0.58X1 X2
Tilastollinen vastepintamallinnus – p. 9/16
Kriittinen piste ja sen laatu
T b + dT Ed,
2. kertaluvun malli:
y
ˆ
(d)
=
b
+
d
0
!
!
missä d =
x1
x2
,b=
b1
b2
, ja E =
b11
1
2 b12
1
2 b12
b22
!
gradientti: ∂ yˆ/∂d = b + 2Ed
kriittinen piste: d = − 12 E−1 b =: z
Schurin hajotelma: E = QΛQT
kanoninen muoto: Jos QT (d − z) =: e, niin
yˆ(d) = yˆ(z) + (d − z)T E(d − z)
= yˆ(z) + eT Λe
X
= yˆ(z) +
λi e2i
i
Tilastollinen vastepintamallinnus – p. 10/16
Kemiallisen prosessin kriittinen piste
vastepinta:
yˆ(d) = 96.60 + 0.03X1 − 0.31X2 − 1.98X12 − 1.83X22 + 0.58X1 X2
!
!
0.03
−1.98
0.29
T
T
= 96.60 + d
+d
d
−0.31
0.29 −1.83
kriittinen piste:
z=
− 12
−1.98
0.29
0.29 −1.83
!−1
0.03
−0.31
!
=
0.00
−0.09
!
ennustettu ääriarvo: yˆ(z) = 96.61
Tilastollinen vastepintamallinnus – p. 11/16
Kemiallisen prosessin ääriarvon laatu
>> [Q,Lambda]=schur([-1.98 .29;.29 -1.83])
Q =
2
-0.7907
0.6122
87
-0.6122
-0.7907
90
93
1
96
X2
Lambda =
-2.2045
0
0
-1.6055
0
-1
-2
-2
Kriittinen piste on maksimi.
←
-1
0
1
2
X1
Vastepinta on vähän kaarevampi Q:n ensimmäisen
sarakkeen suuntaan.
Tilastollinen vastepintamallinnus – p. 12/16
Harjuanalyysi
Jos E ei ole definiitti tai jos kriittinen piste on kaukana,
etsitään ääriarvo ympyrässä Cd0 ,∆i := {d | kd − d0 k = ∆i }.
harju:
satula:
Tilastollinen vastepintamallinnus – p. 13/16
Harjuanalyysin lause
Jos µ > max{λ1 , . . . , λk }, niin E − µI on negatiividefiniitti ja
di := d0 + (E − µI)
−1
1
(− b − Ed0 )
2
on ainoa yˆ(d):n maksimoija joukossa Cd0 ,kdi −d0 k .
Todistus: Jos kd − d0 k = kdi − d0 k, niin
yˆ(d) − yˆ(di ) = (b + 2Edi )T (d − di ) + (d − di )T E(d − di )
= (d − di )T (E − µI)(d − di )
+ (µd − µdi + b + 2Edi )T (d − di )
|
{z
}
µ(kd−d0 k2 −kdi −d0 k2 )
= (d − di )T (E − µI)(d − di )
Tilastollinen vastepintamallinnus – p. 14/16
Harjuanalyysikaavan käyttö
1. Valitse sellainen µi , että µi > max{λ1 , . . . , λk }.
2. Laske
di = d0 + (E − µi I)
−1
1
(− b − Ed0 )
2
∆i = kdi − d0 k
yˆ(di ) = b0 + dTi b + dTi Edi
3. Toista askeleet 1–2 kunnes di on sopivan kaukana
lähtöpisteestä d0 .
4. Suorita koesarja pisteen di ympärillä ja tee uusi
vastepinta.
Tilastollinen vastepintamallinnus – p. 15/16
Yhteenveto
Vastepintamallinnu= koesuunnittelu + regressio + optimointi
suora vastepinta: 2k -koe + 1. kertaluvun regressiomalli
+ etsintä gradientin suuntaan
kaareva vastepinta: CCD-koe + 2. kertaluvun
regressiomalli + ääriarvo tai harjuanalyysi
Lisää tietoa:
Piché, Ruohonen (2003): Tilastollinen vastepintamallinnus
math.tut.fi/˜piche/TKS/pruju.html
Buyske (2001): Advanced Design of Experiments
www.stat.rutgers.edu/˜buyske/591/lect_all.pdf
Tilastollinen vastepintamallinnus – p. 16/16