construcción automática de diccionarios semánticos usando la ...
construcción automática de diccionarios semánticos usando la ...
construcción automática de diccionarios semánticos usando la ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
2.1.4.2.2 Distancia Manhattan:<br />
Fórmu<strong>la</strong> (12) Distancia Manhattan<br />
2.1.4.2.3 Distancia Minkowski:<br />
Fórmu<strong>la</strong> (13) Distancia Minkowski<br />
Don<strong>de</strong>, si q = 1 estamos hab<strong>la</strong>ndo <strong>de</strong> <strong>la</strong> distancia Manhattan y si q = 2 entonces<br />
estamos hab<strong>la</strong>ndo <strong>de</strong> <strong>la</strong> distancia Euclidiana.<br />
2.1.4.2.4 Simi<strong>la</strong>ridad por Coseno<br />
2.1.5 Clustering<br />
Fórmu<strong>la</strong> (14) Distancia por coseno<br />
El Agrupamiento, o Clustering, es el proceso <strong>de</strong> agrupar datos en c<strong>la</strong>ses (clústeres)<br />
<strong>de</strong> manera que los elementos <strong>de</strong> un clúster tengan una simi<strong>la</strong>ridad alta entre ellos, y<br />
baja simi<strong>la</strong>ridad con objetos <strong>de</strong> otros clústeres.<br />
La medida <strong>de</strong> simi<strong>la</strong>ridad está basada en los atributos que <strong>de</strong>scriben a los objetos.<br />
En nuestro caso, <strong>la</strong> medida <strong>de</strong> simi<strong>la</strong>ridad está basada en <strong>la</strong>s ocurrencias <strong>de</strong> cada<br />
término en los diferentes documentos <strong>de</strong>l corpus <strong>de</strong> dominio.<br />
24