globalmente, si avvicina di più al<strong>la</strong> curva loess; più il valore di questo parametroè basso, più <strong>la</strong> curva sarà liscia.Osservando i tre output possiamo dire che, in generale, al crescere dello spandiminuisce il numero di parametri equivalenti; d’altra parte <strong>la</strong> curva tendea seguire di meno i dati quindi si ha un aumento del<strong>la</strong> deviazione standarddei residui. Guardando, invece, come variano i parametri a parità di spanin corrispondenza dei due possibili valori di λ, si nota che, con Loess lineareinvece che quadratico diminuisce il numero di parametri equivalenti, mentre<strong>la</strong> deviazione standard dei residui aumenta di poco, <strong>per</strong> span piccoli, di molto<strong>per</strong> span grandi.1.2.2 Su<strong>per</strong>fici condizionatamente parametricheAbbiamo visto che <strong>una</strong> delle caratteristiche che si possono attribuire al<strong>la</strong>su<strong>per</strong>ficie g è che essa sia parametrica condizionatamente a uno specificosottoinsieme dei predittori. La <strong>tecnica</strong> <strong>per</strong> adattare il metodo Loess a questocaso, è molto semplice. Il sottoinsieme in questione non è contemp<strong>la</strong>to nelcalcolo delle distanze euclidee che vengono usate nel<strong>la</strong> definizione dei pesiw i (x). Un esempio può essere utile <strong>per</strong> comprendere come effettivamente <strong>la</strong>su<strong>per</strong>ficie così ottenuta sia condizionatamente parametrica.Supponiamo che i predittori siano 2, u e v, che λ = 2 e inoltre che sia u ilpredittore rispetto al quale si condiziona. Poichè <strong>la</strong> funzione dei pesi ignora<strong>la</strong> variabile u, il peso i-esimo, w i (u, v), <strong>per</strong> l’approssimazione in (u, v), è paripeso al peso i-esimo, w i (u + t, v), <strong>per</strong> l’approssimazione in (u + t, v). Quindiil polinomio quadratico utilizzato <strong>per</strong> <strong>la</strong> stima in (u, v) è lo stesso polinomioquadratico utilizzato in (u + t, v) <strong>per</strong> qualsiasi valore di t. Ciò significa che,<strong>per</strong> un dato valore di v, <strong>la</strong> su<strong>per</strong>ficie è data proprio da questo polinomioquadratico in funzione del primo predittore.Quando invece si decide che, <strong>per</strong> λ = 2, <strong>la</strong> stima di g debba essere calco<strong>la</strong>tacome funzione di più predittori ma si ritiene che sia più opportuno omettere12
il quadrato di uno di essi, ciò che si fa è semplicemente non utilizzarlo <strong>per</strong> ilcalcolo dell’approssimazione <strong>locale</strong>.1.2.3 Errori non gaussiani e stima robustaSupponiamo che gli errori ε i abbiano <strong>una</strong> distribuzione simmetrica con<strong>una</strong> campana molto stretta e code sottili. Ciò comporta <strong>una</strong> variante delmetodo Loess che si basa su procedure di stima robusta le quali modificanoi pesi assegnati alle singole osservazioni in modo da tenere conto dell’entitàdei residui associati ad esse.Questa variante inizia con <strong>una</strong> stima di ĝ(x) basata su errori gaussiani.Quindi vengono calco<strong>la</strong>ti i residuiˆε i = y i − ĝ(x i )A questo punto viene introdotta <strong>la</strong> funzione biquadratica dei pesi, detta anchefunzione di Tuckey:{(1 − (u/b) 2 ) 2 <strong>per</strong> 0 ≤ |u| < bB(u; b) =0 <strong>per</strong> |u| ≥ bSia m = mediana(|ˆε i |) <strong>la</strong> mediana del valore assoluto dei residui. La correzionedei pesi richiesta dal<strong>la</strong> <strong>tecnica</strong> robusta è allora data da r i = B(ˆε i ; 6m).Una stima aggiornata, ĝ(x), viene quindi calco<strong>la</strong>ta a livello <strong>locale</strong> con i pesiw i sostituiti da r i w i (x), quindi più i residui sono grandi più i pesi attribuitialle osservazioni sono ridotti. La procedura viene ripetuta numerose volte<strong>per</strong> ottenere <strong>la</strong> stima finale.Nel caso in cui non siano gli ε i ad avere varianza σ 2 costante ma gli a i ε i siprocede al<strong>la</strong> stima con pesi dati da a i w i , se gli errori hanno distribuzionegaussiani, oppure da a i r i w i se viene utilizzata <strong>la</strong> <strong>tecnica</strong> robusta.13
- Page 1 and 2: POLITECNICO DI MILANOFacoltà di In
- Page 3 and 4: IndiceIntroduzione 31 La regression
- Page 5 and 6: IntroduzioneArgomento di questa tes
- Page 7 and 8: logia propria della regressione lin
- Page 9 and 10: 1.1.2 Caratteristiche dei termini d
- Page 11 and 12: Esempi illustrativiPer mostrare ope
- Page 13: sta interpolando anche i termini di
- Page 17 and 18: 1.3 Inferenza statistica1.3.1 Stima
- Page 19 and 20: parametriche nelle quali i due valo
- Page 21 and 22: 1.3.3 Il numero di parametri equiva
- Page 23 and 24: 1.3.4 Errori con distribuzione simm
- Page 25 and 26: 1.4 Metodi computazionali per la va
- Page 27 and 28: Figura 1.7: albero k − dIn Figura
- Page 29 and 30: mente interpolanti univariati, ovve
- Page 31 and 32: di lisciamento, è fissato ed è so
- Page 33 and 34: Figura 2.2: α = 0.1Figura 2.3: α
- Page 35 and 36: 2.1.2 Funzioni di tipo splineUn’a
- Page 37 and 38: formulazione generale del tipoy = g
- Page 39 and 40: dall’integrale di g ′′ (x) 2
- Page 41 and 42: La funzione smooth.spline di R offr
- Page 43 and 44: E(ĝ(x)) − g(x) = g(x)g ′′ (x
- Page 45 and 46: 2.2.3 Gradi di libertàNei modelli
- Page 47 and 48: 2.3.1 Determinare il valore dei par
- Page 49 and 50: zata, applicata giustamente in quan
- Page 51 and 52: Essendo σ 2 la varianza dei termin
- Page 53 and 54: Capitolo 3Tecniche a confrontoTutte
- Page 55 and 56: Figura 3.2: osservazioni perturbate
- Page 57 and 58: che costituisce lo spazio dei predi
- Page 59 and 60: Figura 3.7: presenza di outliersIn
- Page 61 and 62: Figura 3.9: stime ottenute tramite
- Page 63 and 64: family da quello di default, gaussi
- Page 65 and 66:
Figura 3.11: esempio di regressione
- Page 67 and 68:
molto rapidamente, quindi se il num
- Page 69 and 70:
1. V 1: depositi bancari e postali2
- Page 71 and 72:
Figura 4.2: istogramma relativo all
- Page 73 and 74:
zona geografica, sesso e titolo di
- Page 75 and 76:
superficie ottenuta è stata stimat
- Page 77 and 78:
tra Nord e Sud e Isole.interazione
- Page 79 and 80:
Figura 4.14: Italia, donneDalle cur
- Page 81 and 82:
Figura 4.18: Nord, donneFigura 4.19
- Page 83 and 84:
Figura 4.22: Centro, donneFigura 4.
- Page 85 and 86:
Figura 4.26: Sud e Isole, donneDa t
- Page 87 and 88:
Figura 4.29: Italia, basso titolo d
- Page 89 and 90:
Figura 4.32: Nord 1 − (V 1 + V 2)
- Page 91 and 92:
Figura 4.36: Centro 1 − (V 1 + V
- Page 93 and 94:
Figura 4.40: Sud e Isole 1 − (V 1
- Page 95 and 96:
Figura 4.43: grafico dei residuiQue
- Page 97 and 98:
appena rimarcati, l’ampiezza di b
- Page 99 and 100:
Appendice ALe funzioni R utilizzate
- Page 101 and 102:
method : di default assume il valor
- Page 103 and 104:
cv : serve per selezionare il param