13.11.2013 Views

construcción automática de diccionarios semánticos usando la ...

construcción automática de diccionarios semánticos usando la ...

construcción automática de diccionarios semánticos usando la ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

simi<strong>la</strong>ridad es una matriz cuadrada, don<strong>de</strong> están todas <strong>la</strong>s pa<strong>la</strong>bras y en <strong>la</strong> diagonal<br />

todos los valores son 1, porque es don<strong>de</strong> se intersectan una pa<strong>la</strong>bra con el<strong>la</strong><br />

misma.<br />

Para esta tesis simu<strong>la</strong>mos esta matriz con una tab<strong>la</strong> con 3 campos, don<strong>de</strong> los<br />

primeros 2 campos son <strong>de</strong> pa<strong>la</strong>bras y el ultimo campo es el valor <strong>de</strong> <strong>la</strong> simi<strong>la</strong>ridad<br />

entre estas 2 pa<strong>la</strong>bras, calcu<strong>la</strong>ndo en base a <strong>la</strong>s frecuencias en el corpus <strong>de</strong><br />

dominio. Utilizando <strong>la</strong> siguiente fórmu<strong>la</strong>:<br />

Fórmu<strong>la</strong> (17) Distancia por coseno<br />

Don<strong>de</strong>:<br />

n es <strong>la</strong> cantidad <strong>de</strong> documentos en el dominio.<br />

x i es <strong>la</strong> frecuencia <strong>de</strong> <strong>la</strong> pa<strong>la</strong>bra x en el documento i.<br />

y i es <strong>la</strong> frecuencia <strong>de</strong> <strong>la</strong> pa<strong>la</strong>bra y en el documento i.<br />

Pa<strong>la</strong>bra1 Pa<strong>la</strong>bra2 Simi<strong>la</strong>ridad<br />

Software algoritmo 0.032<br />

Software algoritmos 0.057<br />

Software almacén 0.018<br />

Software almacenamiento 0.044<br />

Software almacenar 0.086<br />

Software aplicación 0.420<br />

Software archivo 0.203<br />

Software arpanet 0.031<br />

Software arquitectura 0.271<br />

Software artificial 0.029<br />

44

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!