13.11.2013 Views

construcción automática de diccionarios semánticos usando la ...

construcción automática de diccionarios semánticos usando la ...

construcción automática de diccionarios semánticos usando la ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

2.1.3.1.4 TF.IDF<br />

La frecuencia <strong>de</strong> términos (tf) y <strong>la</strong> inversa <strong>de</strong> <strong>la</strong> frecuencia en el documento (idf) se<br />

combinan para obtener una medida conocida como tf.idf.<br />

Fórmu<strong>la</strong> (4) Cálculo <strong>de</strong> Tf.Idf<br />

Don<strong>de</strong>:<br />

tf ij = número <strong>de</strong> ocurrencias <strong>de</strong>l término i en el documento j.<br />

df i = número <strong>de</strong> documentos que contienen i.<br />

= número <strong>de</strong> documentos en una colección (corpus).<br />

2.1.3.2 Log-Likelihood<br />

Log-likelihood es una medida para comparar 2 corpus y ver que tan parecido es uno<br />

<strong>de</strong> otro (Rayson & Garsi<strong>de</strong>, 2000).<br />

Para hacer el cálculo <strong>de</strong> Log-Likelihood, se toman en cuenta los valores observados<br />

(O) <strong>de</strong> cada pa<strong>la</strong>bra en los 2 corpus, el corpus <strong>de</strong> dominio y el corpus general,<br />

aplicando <strong>la</strong> fórmu<strong>la</strong> 1 para calcu<strong>la</strong>r los valores esperados (E), es <strong>de</strong>cir <strong>la</strong>s<br />

ocurrencias que se esperaría que cada pa<strong>la</strong>bra tuviera en cada corpus.<br />

Fórmu<strong>la</strong> (5) Cálculo <strong>de</strong> los Valores Esperados en un corpus.<br />

Con estos valores observados y los valores esperados po<strong>de</strong>mos calcu<strong>la</strong>r el Log-<br />

Likelihood con <strong>la</strong> siguiente fórmu<strong>la</strong>:<br />

18

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!