10.05.2013 Views

Analisis Multivariado 1 (Apunte basado en notas de clases del ...

Analisis Multivariado 1 (Apunte basado en notas de clases del ...

Analisis Multivariado 1 (Apunte basado en notas de clases del ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

mida la distancia <strong>de</strong> g(X) a Y <strong>de</strong> modo tal <strong>de</strong> p<strong>en</strong>alizar los errores <strong>de</strong><br />

prediccion<br />

L(Y, g(X))<br />

si<strong>en</strong>do la funcion <strong>de</strong> perdida clasica la funcion <strong>de</strong> perdida cuadratica<br />

L(Y, g(X)) = [Y − g(X)] 2<br />

Un critrio razonable para elegir la funcion g es pedir minimizar<br />

el valor esperado <strong>de</strong> la funcion <strong>de</strong> perdida, es <strong>de</strong>cir, el error esperado<br />

<strong>de</strong> prediccion es <strong>en</strong> este caso el Error Cuadratico <strong>de</strong> Prediccion <strong>de</strong> la<br />

funcion g<br />

ECP (g) = E (L(Y, g(X))) = E [Y − g(X)] 2 ˆ<br />

= [Y − g(X)] 2 f(X, Y ) =<br />

= EXE Y/X([Y − g(X)] 2 | X)<br />

como <strong>en</strong> la practica el vector X esta fijo (X = x), ti<strong>en</strong>e s<strong>en</strong>tido<br />

condicionar a X, por lo que la funcion buscada ˆg(X) es la que minimiza,<br />

para cada x, la esperanza <strong>en</strong> Y (dado X = x)<br />

ˆg(x) = argminEY/X([Y<br />

− c]<br />

c<br />

2 | X =x)<br />

y el valor c que satisface esto es la esperanza condicional<br />

ˆg(x) = EY (Y | X =x)<br />

pues la esperanza condicional es el valor que minimiza el error<br />

cuadratico esperado. A esta funcion se la d<strong>en</strong>omina g<strong>en</strong>ericam<strong>en</strong>te<br />

Funcion <strong>de</strong> Regresion.<br />

20.2 Variable Y categorica<br />

Supondremos ahora que la variable Y pue<strong>de</strong> tomar los valores Y =<br />

1, 2, . . . , k, es <strong>de</strong>cir, exist<strong>en</strong> k poblaciones a las que pued<strong>en</strong> pert<strong>en</strong>ecer<br />

las observaciones. Asi las funciones predictoras f : R d → {1, 2, . . . , k}<br />

toman valores <strong>en</strong>teros. En este caso la funcion <strong>de</strong> d<strong>en</strong>sidad conjunta<br />

<strong>de</strong>l vector X e Y es<br />

f(X, Y ) = P r(X = x,Y = i) = P r(X = x|Y = i)P r(Y = i) = fi(X)πi<br />

con i ∈ {1, 2, . . . , k} ,don<strong>de</strong><br />

fi(X) es la funcion <strong>de</strong> d<strong>en</strong>sidad <strong>de</strong> las variables explicativas <strong>de</strong> la<br />

poblacion i-esima.<br />

πi la probabilidad, a priori, que un elem<strong>en</strong>to pert<strong>en</strong>ezca a la poblacion<br />

i-esima.<br />

52

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!