construcción automática de diccionarios semánticos usando la ...
construcción automática de diccionarios semánticos usando la ...
construcción automática de diccionarios semánticos usando la ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Pa<strong>la</strong>bra Frec. Frec. Frec. E. Frec. E. Log-Likelihood<br />
Dominio General Dominio General<br />
socket 1 0 0.010286744 0.989713252 9.153798103<br />
sofisticado 5 169 1.789893508 172.2101135 3.912798405<br />
soft 1 12 0.13372767 12.86627197 2.351035118<br />
software 430 831 12.97158432 1248.028442 2334.961182<br />
softwares 2 1 0.030860232 2.969139814 14.50919151<br />
sofware 2 2 0.041146975 3.958853006 12.8037796<br />
sol 2 933 9.618105888 925.381897 -9.016687393<br />
so<strong>la</strong>mente 20 1714 17.83721352 1716.162842 0.254846573<br />
Tab<strong>la</strong> 3-2 Fragmento <strong>de</strong> <strong>la</strong> tab<strong>la</strong> <strong>de</strong> cálculo <strong>de</strong> Log-Likelihood<br />
En <strong>la</strong> tab<strong>la</strong> 3-2 se muestra un conjunto <strong>de</strong> pa<strong>la</strong>bras, con los cálculos<br />
correspondientes para el dominio <strong>de</strong> informática. Don<strong>de</strong>:<br />
• El campo Frec. Dominio y Frec. General son <strong>la</strong>s frecuencias observadas<br />
(Term Frecuency) <strong>de</strong> una pa<strong>la</strong>bra en el corpus <strong>de</strong> dominio y en el Corpus<br />
General respectivamente.<br />
• El campo Frec. E. Dominio y Frec. E. General son <strong>la</strong>s frecuencias esperadas<br />
<strong>de</strong> una pa<strong>la</strong>bra en el corpus <strong>de</strong> dominio y en el Corpus General<br />
respectivamente. Estos valores fueron calcu<strong>la</strong>dos con <strong>la</strong>s siguientes<br />
fórmu<strong>la</strong>s:<br />
Y<br />
Fórmu<strong>la</strong> (15) Cálculo <strong>de</strong> Frecuencia esperada<br />
Don<strong>de</strong>:<br />
E d y E g son los valores esperados en el corpus <strong>de</strong> dominio y en el corpus<br />
General respectivamente.<br />
42