10.05.2013 Views

Analisis Multivariado 1 (Apunte basado en notas de clases del ...

Analisis Multivariado 1 (Apunte basado en notas de clases del ...

Analisis Multivariado 1 (Apunte basado en notas de clases del ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Hay que <strong>de</strong>finir una funcion <strong>de</strong> perdida conv<strong>en</strong>i<strong>en</strong>te para este problema.<br />

En g<strong>en</strong>eral podriamos p<strong>en</strong>sar que si la funcion g predice el<br />

verda<strong>de</strong>ro valor <strong>de</strong> Y la perdida <strong>de</strong>biera ser 0, y el error para los <strong>de</strong>mas<br />

casos <strong>de</strong>p<strong>en</strong><strong>de</strong>ra <strong>de</strong>l verda<strong>de</strong>ro valor Y = i y <strong>de</strong>l valor predicho<br />

g(X) = j. En los problemas <strong>de</strong> clasificacion a la funcion <strong>de</strong> perdida<br />

se la conoce <strong>en</strong> g<strong>en</strong>eral cmo funcion <strong>de</strong> costos C(.) (<strong>de</strong> mala clasificacion).<br />

Esta funcion es aleatoria, pues <strong>de</strong>p<strong>en</strong><strong>de</strong> tanto <strong>de</strong>l vector X<br />

como <strong>de</strong> Y , asi <strong>de</strong>finimos<br />

L(Y, g(X)) =<br />

k<br />

i=1 j=1<br />

k<br />

C(j|i)I(Y = i)I(X ∈ Rj)<br />

Es fundam<strong>en</strong>tal notar que la s<strong>en</strong>t<strong>en</strong>cia g(X) = j es equival<strong>en</strong>te<br />

a I(X ∈ Rj) = 1, <strong>de</strong> esta manera la <strong>de</strong>finicion <strong>de</strong> un metodo <strong>de</strong><br />

clasificacion (g(.)) establece una particion <strong>de</strong>l espacio R d <strong>en</strong> k regiones<br />

ℜ = (R1, R2, . . . , Rk) tales que R d = ∪ i Ri con Ri ∩Rj = Ø para i = j.<br />

Calculemos ahora el error esperado <strong>de</strong> prediccion<br />

EP (g) = E (L(Y, g(X))) =<br />

⎡<br />

k<br />

E ⎣<br />

k<br />

i=1 j=1<br />

k<br />

i=1 j=1<br />

i=1 j=1<br />

k<br />

C(j|i)E [I(Y = i)I(X ∈ Rj)] =<br />

⎤<br />

k<br />

C(j|i)I(Y = i)I(X ∈ Rj) ⎦ =<br />

k<br />

i=1 j=1<br />

k<br />

C(j|i)P r (X ∈ Rj|Y = i)) P r(Y = i) =<br />

´ . . . ´<br />

x∈R<br />

k<br />

j=1 I(X ∈ Rj) k<br />

i=1 C(j|i)πifi(x)dx =<br />

k<br />

C(j|i)P r [Y = i, X ∈ Rj] =<br />

k<br />

k<br />

i=1 j=1<br />

ˆ<br />

ˆ<br />

. . .<br />

x∈R<br />

ˆ<br />

C(j|i)<br />

ˆ<br />

. . .<br />

x∈Rj<br />

don<strong>de</strong> hj(x) = k i=1 C(j|i)πifi(x) = <br />

i=j C(j|i)πifi(x) solo <strong>de</strong>p<strong>en</strong><strong>de</strong><br />

<strong>de</strong> x. Es importante notar que el metodo <strong>de</strong> clasificacion se<br />

halla <strong>de</strong>terminado por la expresion I(X ∈ Rj), que <strong>de</strong>fine la particion.<br />

Por lo tanto<br />

EP (g) = E (L(Y, g(X))) =<br />

ˆ<br />

ˆ<br />

. . .<br />

x∈R<br />

fi(x)dxπi =<br />

k<br />

I(X ∈ Rj)hj(x)dx<br />

j=1<br />

k<br />

I(X ∈ Rj)hj(x)dx<br />

Ahora vamos a ver que para <strong>en</strong>contrar la particion que minimice esta<br />

expresion alcanza con elegir, para cada x, la region (j) que minimice<br />

hj(x), es <strong>de</strong>cir que la regla <strong>de</strong> clasificacion optima sera<br />

recordando que<br />

j=1<br />

x ∈ Rj ⇔ hj(x) = min<br />

i∈{1,2,...,k} hi(x)<br />

53

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!