13.11.2013 Views

construcción automática de diccionarios semánticos usando la ...

construcción automática de diccionarios semánticos usando la ...

construcción automática de diccionarios semánticos usando la ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

2 ESTADO DEL ARTE<br />

2.1 Conceptos básicos<br />

Para po<strong>de</strong>r enten<strong>de</strong>r los siguientes capítulos <strong>de</strong> esta tesis es necesario introducir<br />

los conceptos básicos con los que trabajaremos.<br />

2.1.1 Stopword<br />

Las <strong>la</strong>s pa<strong>la</strong>bras <strong>de</strong>nominadas stopwords son <strong>la</strong>s que no incluyen información al<br />

dominio, para esta tesis, consi<strong>de</strong>ramos que <strong>la</strong>s pa<strong>la</strong>bras que no son sustantivos,<br />

verbos, adjetivos o adverbios, son stopword. Estas pa<strong>la</strong>bras no serán tomadas en<br />

cuenta al construir el diccionario semántico.<br />

2.1.2 Lematización<br />

Las pa<strong>la</strong>bras con el mismo lema serán contabilizadas como una so<strong>la</strong> pa<strong>la</strong>bra (el<br />

lema), <strong>de</strong> modo que pa<strong>la</strong>bras como trabaja, trabajar, trabajamos, suman a <strong>la</strong><br />

frecuencia <strong>de</strong> <strong>la</strong> pa<strong>la</strong>bra trabajar que es el lema <strong>de</strong> todas el<strong>la</strong>s.<br />

2.1.3 Extracción <strong>de</strong> Términos Relevantes<br />

Existen muchos mo<strong>de</strong>los para pon<strong>de</strong>rar términos en un corpus. El más conocido es<br />

Tf.Idf.<br />

2.1.3.1 TF.IDF<br />

Esta medida, permite comprobar el peso <strong>de</strong> un término (unidad léxica) en un<br />

documento (unidad <strong>de</strong> contexto).<br />

16

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!