13.11.2013 Views

construcción automática de diccionarios semánticos usando la ...

construcción automática de diccionarios semánticos usando la ...

construcción automática de diccionarios semánticos usando la ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

o Implementar método para cálculo <strong>de</strong> Log-Likelihood.<br />

o Implementar método para cálculo <strong>de</strong> Tf.Idf.<br />

• Modulo para cálculo <strong>de</strong> Simi<strong>la</strong>ridad entre 2 pa<strong>la</strong>bras.<br />

o Implementar método <strong>de</strong>l coseno <strong>de</strong>l ángulo.<br />

• Módulo para clusterización <strong>de</strong> términos.<br />

o Implementar el método K-Means.<br />

Hacer los Siguientes Experimentos:<br />

• Experimentos con un corpus <strong>de</strong> Informática, <strong>de</strong>scargados <strong>de</strong><br />

www.wikipedia.com, comparándolo con un corpus general que serán <strong>la</strong>s<br />

noticias <strong>de</strong>l periódico Excélsior.<br />

Al terminar <strong>la</strong> tesis se esperan obtener los siguientes productos:<br />

o Metodología <strong>de</strong> <strong>construcción</strong> <strong>de</strong> <strong>diccionarios</strong> <strong>semánticos</strong> a partir <strong>de</strong> los textos<br />

especializados, utilizando un conjunto <strong>de</strong> métodos estadísticos.<br />

o Extracción <strong>de</strong> términos. Utilizando el algoritmo Log-Likelihood.<br />

o Extracción <strong>de</strong> ciertas re<strong>la</strong>ciones semánticas. Utilizando el método <strong>de</strong>l<br />

coseno <strong>de</strong>l ángulo.<br />

o Construcción <strong>de</strong>l diccionario semántico.<br />

o Prototipo <strong>de</strong> software que toma como entrada un conjunto <strong>de</strong> textos y<br />

construye un diccionario semántico tipo ontología en modo automático (sin<br />

alguna intervención <strong>de</strong>l usuario).<br />

14

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!