Analisis Multivariado 1 (Apunte basado en notas de clases del ...
Analisis Multivariado 1 (Apunte basado en notas de clases del ...
Analisis Multivariado 1 (Apunte basado en notas de clases del ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
mida la distancia <strong>de</strong> g(X) a Y <strong>de</strong> modo tal <strong>de</strong> p<strong>en</strong>alizar los errores <strong>de</strong><br />
prediccion<br />
L(Y, g(X))<br />
si<strong>en</strong>do la funcion <strong>de</strong> perdida clasica la funcion <strong>de</strong> perdida cuadratica<br />
L(Y, g(X)) = [Y − g(X)] 2<br />
Un critrio razonable para elegir la funcion g es pedir minimizar<br />
el valor esperado <strong>de</strong> la funcion <strong>de</strong> perdida, es <strong>de</strong>cir, el error esperado<br />
<strong>de</strong> prediccion es <strong>en</strong> este caso el Error Cuadratico <strong>de</strong> Prediccion <strong>de</strong> la<br />
funcion g<br />
ECP (g) = E (L(Y, g(X))) = E [Y − g(X)] 2 ˆ<br />
= [Y − g(X)] 2 f(X, Y ) =<br />
= EXE Y/X([Y − g(X)] 2 | X)<br />
como <strong>en</strong> la practica el vector X esta fijo (X = x), ti<strong>en</strong>e s<strong>en</strong>tido<br />
condicionar a X, por lo que la funcion buscada ˆg(X) es la que minimiza,<br />
para cada x, la esperanza <strong>en</strong> Y (dado X = x)<br />
ˆg(x) = argminEY/X([Y<br />
− c]<br />
c<br />
2 | X =x)<br />
y el valor c que satisface esto es la esperanza condicional<br />
ˆg(x) = EY (Y | X =x)<br />
pues la esperanza condicional es el valor que minimiza el error<br />
cuadratico esperado. A esta funcion se la d<strong>en</strong>omina g<strong>en</strong>ericam<strong>en</strong>te<br />
Funcion <strong>de</strong> Regresion.<br />
20.2 Variable Y categorica<br />
Supondremos ahora que la variable Y pue<strong>de</strong> tomar los valores Y =<br />
1, 2, . . . , k, es <strong>de</strong>cir, exist<strong>en</strong> k poblaciones a las que pued<strong>en</strong> pert<strong>en</strong>ecer<br />
las observaciones. Asi las funciones predictoras f : R d → {1, 2, . . . , k}<br />
toman valores <strong>en</strong>teros. En este caso la funcion <strong>de</strong> d<strong>en</strong>sidad conjunta<br />
<strong>de</strong>l vector X e Y es<br />
f(X, Y ) = P r(X = x,Y = i) = P r(X = x|Y = i)P r(Y = i) = fi(X)πi<br />
con i ∈ {1, 2, . . . , k} ,don<strong>de</strong><br />
fi(X) es la funcion <strong>de</strong> d<strong>en</strong>sidad <strong>de</strong> las variables explicativas <strong>de</strong> la<br />
poblacion i-esima.<br />
πi la probabilidad, a priori, que un elem<strong>en</strong>to pert<strong>en</strong>ezca a la poblacion<br />
i-esima.<br />
52