13.11.2013 Views

construcción automática de diccionarios semánticos usando la ...

construcción automática de diccionarios semánticos usando la ...

construcción automática de diccionarios semánticos usando la ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

4 EXPERIMENTOS Y RESULTADOS<br />

4.1 Experimento 1:<br />

4.1.1 Descripción<br />

Para este experimento se utilizaron los siguientes corpus:<br />

Corpus <strong>de</strong> comparación: son <strong>la</strong>s noticias <strong>de</strong>l periódico Excélsior, 247 archivos, con<br />

11, 936,114 pa<strong>la</strong>bras en total.<br />

Corpus <strong>de</strong> dominio: utilizamos algunas páginas <strong>de</strong> wikipedia re<strong>la</strong>cionadas al área <strong>de</strong><br />

informática, tales como, informática, software, programación, etc. Son 72 archivos<br />

con 142,132 pa<strong>la</strong>bras.<br />

Por lo tanto, el diccionario semántico resultante será para el dominio <strong>de</strong> Informática.<br />

4.1.2 Resultados<br />

En <strong>la</strong> segunda fase, <strong>la</strong> <strong>de</strong> extracción <strong>de</strong> términos, los 15 términos más relevantes<br />

<strong>de</strong>l dominio <strong>de</strong> informática, y su respectiva pon<strong>de</strong>ración con el algoritmo loglikelihood,<br />

fueron los siguientes.<br />

Pa<strong>la</strong>bra<br />

Log-likelihood<br />

Dato 2543<br />

Sistema 2345<br />

Software 2279<br />

Computador 1713<br />

Lenguaje 1438<br />

Maquina 1371<br />

48

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!