003bis Appendice alla Dispensa n.3:Ulteriori metodi per la stima di

1
Materiali didattici: ANALISI E PREVISIONI
NEI MERCATI FINANZIARI
a.a. 2014-2015
DISPENSA N.3bis
(APPENDICE alla dispensa n.3)
Ulteriori metodi per la stima di una singola equazione
(Prof. Giovanni Verga)
1. Variabili limitate: p.2
2. Code molto alte delle distribuzioni dei residui: LAD e regressione quantile: p.9
3. Una o più variabile indipendente influenzata dalla dipendete (problema della mancanza di
esogeneità debole): variabili strumentali, il GMM: p. 12.
1
Ulteriori metodi per la stima di una singola equazione
Il metodo più tradizionale di stima (i minimi quadrati ordinari) in alcuni casi risultato inappropriati, nel
senso che danno risultati distorti o inefficienti.
Per quanto ci riguarda, i casi principali in cui questo si verifica sono i seguenti:
- Variabili limitate
- Code molto alte delle distribuzioni
- Una o più variabile indipendente che può essere influenzata dalla dipendete (problema della
mancanza di esogeneità debole).
1. Variabili limitate
I principali casi di variabili limitate che ci possono interessare sono due:
- La dipendente può assumere solo alcuni valori (es. 0 e 1)
- La dipendente non può oltrepassare certi valori (es. non può assumere valori negativi)
1a. Dipendente Dicotomica
Un esempio è il seguente:
Una volta aperto con GRETL il file banche_2007_08.wf1, che contiene alcuni dati delle banche
dell’Eurozona del 2007 e 2008 (alla domanda che appare all’apertura del file rispondere di no), tra le
variabili vi è la variabile PERDITE2008, i cui valori sono 0 se nel 2008 la banca non ha avuto perdite, 1 se
nel ha avuto perdite. Può essere interessante stimare la probabilità che nel 2008 una banca abbia avuto una
perdita conoscendo il ROE e il ROA dell’anno precedente (ROE2007 e ROA2007). Si tratta quindi di
stimare PERDITE2008 in funzione di ROE2007 e ROA2007 sapendo che la dipendente può assumere solo
i valori 0 e 1 e che la stima della probabilità non può essere né negativa né superare l’unità.
Vi sono due tecniche di stima appropriate per questo problema: Probit e Logit. Il primo suppone che la
relazione tra la dipendente e i regressori segua la distribuzione cumulata di una normale, il secondo che
segua una logistica.
Con GRETL si procede in questo modo:
- Cliccare su Modello
-
Variabile dipendente limitata
- Probit
- Binario…
Poi mettere PERDITE2008 come dipendente e ROE2007 e ROA2007 come indipendenti,
Cliccare su Imposta come predefinito, Errori standard robusti, Mostra i p-value.
Togliere invece Mostra i dettagli per le iterazioni perché non servono
Cliccare su OK per vedere la stima
2
Toglierlo !!!!!
Ecco il risultato:
3
Dalla stima risulta che la probabilità che una banca abbia avuto delle perdite nel 2008 era tanto maggiore
quanto peggiori erano stati gli indici di redditività ROE e ROA del 2007. Dei due indici, però, solo il ROE è
significativo.
Nel complesso la regressione prevede correttamente la posizione della banca del 2008 (“in perdita” o “non in
perdita”) nell’89.9% dei casi
Nel caso del metodo Logit si precede allo stesso modo.
Il risultato sarebbe stato il seguente:
4
I risultati sono coerenti con quelli ottenuti col modello Probit, ma in questo caso risulta significativo anche il
ROA del 2007.
1.b La dipendente non può oltrepassare certi valori (Tobit)
Il metodo di stima usato per questo caso è detto anche Tobit.
Un caso interessante è quello già visto per la stima del tasso ufficiale mediante le variabili economiche. Il
tasso ufficiale in un certo periodo non poteva scendere sotto l’1%. Abbiamo già visto il metodo degli OLS
non lineari, ma in alternativa si può usare anche il Tobit imponendo 1 come “limite sinistro” (cioè
inferiore). Nel nostro caso non c’è invece alcun “limite destro” (superiore) che non va quindi indicato.
Il procedimento con GRETL è il seguente:
5
Aprire il file Repo_e_variabili_economiche_2015.wf1:
Cliccare su Modello
- Variabile dipendente limitata
- Tobit
Mettere 1 come limite sinistro, poi cliccare su imposta come predefinito e errori standard robusti.
Mettere poi REPOB come dipendente e mettere le variabili indipendenti, più la ritardata di REPOB
esattamente come fatto in precedenza per questa equazione
Dare l’OK per avere il risultato
6
I segni sono tutti quelli attesi e i coefficienti sono tutti significativi.
Il grafico dei residui e dei valori effettivi e stimati si ottengono cliccando su Grafici in alto nella schermata
del risultato.
Va però osservato che il grafico dei residui mostra i residui stimati tenendo conto della condizione imposta,
mentre il grafico dei valori stimati mostra quale sarebbe il grafico della stima non tenendo conto della
restrizione imposta. Nel grafico, infatti, il valore di REPOB scende infatti sotto 1.
7
Lo stesso vale per quanto riguarda i valori effettivi, stime, residui, che si ottengono cliccando su Analisi in
alto nella schermata del risultato.
Intervallo di stima del modello: 1999:02 - 2009:12
Errore standard dei residui = 1,79769e+308
REPOB
Stime
Residuo
1999:02
1999:03
……
2009:04
2009:05
2009:06
2009:07
2009:08
2009:09
2009:10
2009:11
2009:12
3,00
3,00
…..
1,25
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
2,86
2,89
….
1,13
0,95
0,71
0,67
0,67
0,70
0,70
0,70
0,71
8
0,13
0,10
….
0,12
-0,08
-0,01
-0,00
-0,00
-0,00
-0,00
-0,00
-0,00
2. Code molto alte delle distribuzioni dei residui: LAD e regressione quantile
Un caso in cui i minimi quadrati non danno buoni risultati è quello di distribuzioni dei residui con code
particolarmente elevate.
Questo capita spesso utilizzando dati dei bilanci delle banche e delle imprese.
Riapriamo con GRETL il file banche_2007_08.wf1, che contiene alcuni dati delle banche dell’Eurozona del
2007 e 2008 (alla domanda che appare all’apertura del file rispondere di no),
Questa volta vogliamo stimare il ROA del 2008 (ROA2008) in funzione del leverage del 2007 (LEV2007) e
del rapporto tra prestiti e totale attivo del 2007 (PRESTAT2007).
Come si rileva chiaramente dal grafico dei residui, la distribuzione è ben lontana dalla normale e
fortissimamente lepotocurtica;
In queste condizioni l’impiego degli OLS è improponibile.
9
Stime migliori si ottengono con i metodi delle stime robuste.
In particolare con LAD e Regressione Quantile.
A differenza dei minimi quadrati, che stimano i parametri minimizzando la somma dei quadrati degli scarti, i
LAD stimano i parametri minimizzadno la somma dei valori assoluti degli scarti, che è una misura molto
meno sensibile ai valori estremi. La regressione quantile è analoga alla stima LAD se come quantile si
prende la mediana (quantile = 0,50). Ha però il vantaggio che il quantile può essere scelto a piacere. Per
esempio, nel caso in esame, se l’attenzione di chi fa l’analisi è soprattutto dedicata alle banche con cattivi
risultati economici si può prendere un quantile più basso della mediana, per esempio il primo 20%
(quantile=0,20).
Poiché i coefficienti della regressione risultano molto piccoli dato che i regressori sono molto grandi,
abbiamo diviso i due regressori per 1000000 e abbiamo così definito LEV2007A=LEV2007/1000000 e
PRESTAT2007A=PRESTAT2007/1000000. Il calcolo delle nuove variabili (effettuato come già visto in
precedenza mediante le istruzioni Aggiungi e Definisci nuova variabile), pur non necessario, è utile per
avere dei coefficienti con contrassegnati da numeri con l’esponenziale che sono di scarsa comprensione.
Per la stima LAD si procede cliccando su Modello, Stima robusta, LAD.
Quando si apre la finestra introduciamo la variabile dipendente e le indipendenti, poi clicchiamo su imposta
come predefinito
10
E infine diamo l’OK per avere la stima (attenzione: l’eleaborazione richiede qualche secondo)
Risulta che sia il leverage che il rapporto prestiti/attivo del 2007 hanno esercitato un effetto negativo sul
ROA del 2008. Purtroppo i p-value non sono probabilmente corretti perché i coefficienti non risultano
significativi, mentre l’analisi condotta con un altro programma (Eviews) dà gli stessi coefficienti ma con pvalue fortemente significativi
Il calcolo con la regressione quantile va condotta in modo del tutto analogo.
11
Mantenendo a 0,5 il quantile, dopo aver premuto su OK si ottiene il seguente risultato (anche qui attendere
qualche secondo per l’elaborazione):
Avendo scelto la mediana (quantile desiderato=0,5) i risultati sono gli stessi ottenuti col metodo precedente.
Purtroppo anche qui i p-value non sono probabilmente corretti perché i coefficienti non risultano
significativi, mentre l’analisi condotta con un altro programma (Eviews) dà gli stessi coefficienti ma con pvalue fortemente significativi
3. Una o più variabile indipendente influenzata dalla dipendete (problema della
mancanza di esogeneità debole): variabili strumentali, il GMM
In una regressione del tipo
(1) Yt = f(Xt, Zt, Yt-1, Xt-1, Zt-1, ….)
Può succedere che Xt o Zt, o entrambi, non siano esogeni, cioè che esista una relazione del tipo
(2) Xt = g(Yt, Zt, Yt-1, Xt-1, Zt-1, ….)
che non permette di stabilire se la relazione (1) sia veramente tale o non piuttosto una stima della (2), o
ancora un miscuglio di entrambe.
Un esempio classico è la funzione keynesiana del consumo, dove (1) Ct = a + b Yt, ma, nel contempo, (2) Yt
= Ct + It + Gt : il consumo dipende dal reddito, ma a sua volta il reddito è legato al consumo.
12
Si dimostra che quando questo avviene la variabile indipendente in t diventa correlata con l’errore della
regressione e questo fatto può rendere completamente distorte le stime ottenute con i minimi quadrati
ordinari.
I metodi per affrontare questo problema sono detti delle “variabili strumentali” e uno dei più usato è il
“metodo dei momenti generalizzati” GMM.
Per poter utilizzare questi metodi occorre però avere a disposizione degli “strumenti”, cioè delle variabili che
sono legate alla variabile indipendente influenzata dalla dipendente, ma non sono legate ai residui della
regressione (in poche parole; occorre che gli strumenti non siano influenzati dalla dipendente). Spesso come
strumenti si prendono i valori passati delle variabili, mentre per la scelta degli strumenti in t si fa spesso
affidamento sulle nostre conoscenze delle relazioni economiche che intercorrono tra le variabili.
Una volta decisi gli strumenti, nella regressione GMM andranno indicati tali strumenti, cui vanno aggiunti
tutti gli altri regressori. Il numero degli strumenti non deve comunque essere minore di quello dei regressori
e lo stesso strumento non può essere introdotto due volte.
Sia riconsideri la precedente equazione (1) Yt = f(Xt, Zt, Yt-1, Xt-1, Zt-1, ….) dove per la (2) il regressore
Xt è a sua volta influenzato da Yt. Si supponga che gli strumenti di Xt siano Wt, Xt-1 e Yt-1. Il complesso
degli strumenti da introdurre nella regressione saranno quindi Wt, Xt-1 e Yt-1, cui si aggiungono i regressori
Zt e Zt-1. I regressori Yt-1 e Xt-1 sono già presenti tra gli strumenti di Xt e quindi non vanno più aggiunti.
E’ opportuno osservare che i metodi delle variabili strumentali danno, a differenza dei minimi quadrati,
risultati non distorti (un-biased) che però sono meno efficienti. In particolare la loro efficienza è sensibile a
quanto a loro volta gli strumenti siano legati al rispettivo regressore. Nell’esempio è quindi opportuno
controllare se la regressione Xt = h(Wt, Xt-1, Yt-1) (calcolata con gli OLS) sia “soddisfacente” (se qualche
coefficiente è significativo e l’R2 sembra accettabile). Se questa regressione è considerata soddisfacente,
allora si può passare a una seconda prova che consiste (1) nel calcolare i residui Ut dell’equazione Xt =
h(Wt, Xt-1, Yt-1) (cioè Ut = Xt – h(Wt, Xt-1, Yt-1), (2) stimare con i minimi quadrati ordinari la relazione
(1) con aggiunto Ut tra i regressori, cioè:
(1bis)
Yt = f(Xt, Zt, Yt-1, Xt-1, Zt-1, …, Ut)
Se Ut è significativo i coefficienti dei minimi quadrati sono distorti (biased) e si deve passare alla stima con
le variabili strumentali GMM. Se Ut non è significativo significa invece che la variabile Xt non è
significativamente influenzata dalla Yt dell’equazione (2) (è esogena) e i minimi quadrati non sono distorti
(unbiased) e quindi non è necessario utilizzare i GMM.
Va però osservato che alcuni utilizzano direttamente le variabili strumentali senza prima fare questi due test
(bontà degli strumenti e distorsione dei minimi quadrati). Alcuni programmi (per es, Eviews) eseguono però
automaticamente questi due test quando si effettua una stima GMM, così che l’utente possa valutarne
l’affidabilità e decidere se usare la stima GMM o quella dei minimi quadrati. Utilizzano un programma che
calcola i GMM senza verificarne la loro affidabilità è però molto pericoloso.
Facciamo un paio di esempi.
13
3.1 Legame tra inflazione e crescita della moneta
Aprire il file dati_annuali_wf1. Il file contiene i dati annui italiani dal 1861 al 1994 di:
- LP: logaritmo dei prezzi)
- LM2A: logaritmo della moneta M2 divisa per il numero degli abitanti)
- FINMON: finanziamento monetario del tesoro
- FINMONM2: finanziamento monetario del tesoro in percentuale della moneta esistente nell’anno
precedente.
L’ipotesi è che una crescita eccessiva della moneta provochi inflazione. Nel contempo, però, l’aumento dei
prezzi fa aumentare il fabbisogno di moneta e quindi la relazione
(1) ΔLP = a + b ΔLM2A è probabilmente spuria, nel senso che potreberre essere mischiata con
(2) ΔLM2A = a’ + b’ ΔLP
Per eseguire la stima della (1) generiamo innanzitutto le variazioni di LP e LM2A.
Come strumenti per ΔLM2A possiamo prendere i suoi valori dell’anno precedente, i valori della variazione
ΔLP dell’anno precedente, i due indici della liquidità creata dal tesoro in t (il cui andamento era
esogenamente deciso da tesoro e Banca d’Italia e non dalle famiglie e dalle imprese cui invece compete la
domanda di moneta).
Controlliamo la bontà dei nostri strumenti. Usiamo i minimi quadrati dove, come dipendente, c’è d_LM2A:
14
15
La regressione è buona, sia in termini di significatività dei coefficienti, sia in termini dell’R2. Però alcuni
coefficienti non sono significativi. Possiamo cominciare a eliminare FINMON che è la variabile meno
significativa.
Eliminiamo poi anche l’inflazione in t.1 che non è significativa. Si arriva così a:
Da cui risulta che gli strumenti utili per d:LM2A sono solo il suo valore ritardato d:LM2A_1 e FINMONM2.
A questo punto salviamo il residuo della regressione cliccando su Salva e Residui. Quando si apre la
finestra mettiamo a piacimento un nome come nome della variabile (es. pippo)
Ora verifichiamo la distorsione degli OLS, ovvero l’esogeneità della variazione della moneta, introducendo
nella regressione (1), calcolata con i minimi quadrati ordinari, anche il residuo pippo.
16
Il coefficiente di pippo è signifiativo, quindi d_LM2A non è esogeno e quindi la stima ottenuta con i minimi
quadrati è distorta.
17
Stimiamo allora la nostra equazione (1) con i GMM, uno dei principali metodi delle variabili strumentali.
Gli strumenti saranno d_LM2A dell’anno precedente e FINMONM2.
Il procedimento è questo:
Cliccare su Modello, Variabili strumentali, GMM:
Mettere d_LP come dipendente, d_LM2A come indipendente e FINMONM2 come strumento.
Poi cliccare su Ritardi per mettere il ritardo di d_LM2A tra gli strumenti
18
Diamo l’OK
19
Diamo ancora l’OK e otteniamo la stima GMM:
Il coefficiente corretto della variazione della moneta è 1,15715, significativo all’1%. Nel periodo
considerato, quindi, a una forte incremento della moneta ha corrisposto un forte incremento dell’inflazione.
Ecco il grafico:
20
3.2 Legame tra i tassi forward a 7-10 anni in euro e in dollari.
Apriamo il file rigobon_zforward.wf1.
Il file contiene la variazione del forward a 7-10 anni dell’Eurirs (DEY7_10) e dell’Irs in dollari (DUY7_10)
del giorno della riunione della Fed e del giorno successivo.
Si vuole stimare la relazione
(1) DE7_10 = a + b DU7_10
sapendo che potrebbe anche esiste una relazione
(2) DU7_10 = a’ + b’ DE7_10
che va dall’Europa agli Stati Uniti.
In questo caso particolare l’analisi di Rigobon suggerisce come determinare lo strumento per DU7_10 che è
già stato calcolato e è stato chiamanto WU.
A questo punto procediamo come nel caso precedente:
Controlliamo la bontà dello strumento effettuando la regressione di DU7_10 su WU:
21
Il coefficiente di WU è altamente significativo, quindi possiamo proseguire.
Calcoliamo il residui di quest’equazione. Questa volta lo chiamiamo RES.
Stimiamo con i minimi quadrati ordinari l’equazione (1) con aggiunto RES come ulteriore variabile
indipendente.
Questa volta il coefficiente del residuo RES non è significativo.
Ne consegure che la variabile DUY7_10 si può considerare esogena e i minumi quadrati ordinari (OLS) non
distorti.
Usiamo allora gli OLS; ecco la stima:
22
A un aumento del forward sull’Irs in dollari corrisponde un aumento dell’Euris di 0,24: il tasso americano
influenza il tasso europeo.
Vediamo che cosa avremmo ottenuto con i GMM:
Il coefficiente sarebbe stato un po’ più piccolo (0.185) e la sua significatività un po’ minore.
FINE
23