13.11.2013 Views

construcción automática de diccionarios semánticos usando la ...

construcción automática de diccionarios semánticos usando la ...

construcción automática de diccionarios semánticos usando la ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

2.1.4.2.2 Distancia Manhattan:<br />

Fórmu<strong>la</strong> (12) Distancia Manhattan<br />

2.1.4.2.3 Distancia Minkowski:<br />

Fórmu<strong>la</strong> (13) Distancia Minkowski<br />

Don<strong>de</strong>, si q = 1 estamos hab<strong>la</strong>ndo <strong>de</strong> <strong>la</strong> distancia Manhattan y si q = 2 entonces<br />

estamos hab<strong>la</strong>ndo <strong>de</strong> <strong>la</strong> distancia Euclidiana.<br />

2.1.4.2.4 Simi<strong>la</strong>ridad por Coseno<br />

2.1.5 Clustering<br />

Fórmu<strong>la</strong> (14) Distancia por coseno<br />

El Agrupamiento, o Clustering, es el proceso <strong>de</strong> agrupar datos en c<strong>la</strong>ses (clústeres)<br />

<strong>de</strong> manera que los elementos <strong>de</strong> un clúster tengan una simi<strong>la</strong>ridad alta entre ellos, y<br />

baja simi<strong>la</strong>ridad con objetos <strong>de</strong> otros clústeres.<br />

La medida <strong>de</strong> simi<strong>la</strong>ridad está basada en los atributos que <strong>de</strong>scriben a los objetos.<br />

En nuestro caso, <strong>la</strong> medida <strong>de</strong> simi<strong>la</strong>ridad está basada en <strong>la</strong>s ocurrencias <strong>de</strong> cada<br />

término en los diferentes documentos <strong>de</strong>l corpus <strong>de</strong> dominio.<br />

24

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!