03.05.2013 Views

Paper - Hogeschool Gent

Paper - Hogeschool Gent

Paper - Hogeschool Gent

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Hoofdstuk 5. Resultaten 48<br />

Naar mate de TrS ratio daalt, stijgen de minimale en maximale F1 measure. Deze stijging<br />

word mooi geïllustreerd door de testen 2, 3, 4 en 7 in figuur 5.7 (p. 47). Bij een TrS ratio<br />

van 0, 125 (test 7) is het effect maximaal. De TrS ratio nog verder verkleinen, zorgt ervoor<br />

dat de resultaten terug dalen. Onderstaande tabel toont de grootste verbeteringen tussen<br />

de baseline (test 1) en test 7.<br />

min F1 △ min F1 max F1 △ max F1<br />

1 24,2% 55,1%<br />

7 53,7% +29,5% 63,6% +8,5%<br />

16 48,5% +24,3%<br />

18 91,6% +36,5%<br />

Tabel 5.4: De grootste verbeteringen met onevenwichtig trainen.<br />

De tweede manier van optimalisatie door onevenwicht focust op de NoF ratio. In de eerste<br />

manier wordt de baseline verbetert door de TrS ratio te verminderen in de richting van de<br />

TrS ratio van de testset en NoF- en NoF+ niet te limiteren. Voor de tweede manier wordt<br />

de NoF ratio vastgelegd en mogen NoF- en NoF+ variëren. Er werd een nieuwe baseline<br />

gecreëerd voor dit soort test. De resultaten van de nieuwe baseline zijn aangeduid als test<br />

10. De NoF ratio werd vastgelegd op 1, 00 en TrS- wordt gevarieerd van 500 tot en met<br />

2500. De TrS ratio varieert daarmee van 1, 0 tot en met 0, 2.<br />

Om de NoF ratio aan te passen, zijn er terug verschillende mogelijkheden. Eén daarvan<br />

is om de NoF+ te beperken. Dit wordt gedemonstreerd in testen 20 tot en met 23. De<br />

resultaten zijn echter niet naar verwachting. Ten opzichte van de nieuwe baseline zijn er<br />

enkel dalende resultaten te noteren naar mate de NoF ratio afneemt.<br />

Een tweede mogelijkheid om de NoF ratio aan te passen, is het beperken van NoF-. Bij deze<br />

manier van onevenwichtig trainen worden de beste resultaten geproduceerd. De maximale<br />

F1 measure stijgt zelfs boven de 90%. Pas wanneer de NoF ratio gelijk wordt aan 8, 00 in<br />

test 14 begint de maximale F1 measure flink te stijgen. In test 16 maakt de minimum F1<br />

measure een sprong omhoog. De F1 measure piekt in test 18, wanneer de NoF ratio 40<br />

bedraagt. De resultaten verbeteren dus wanneer het omgekeerde van de NoF ratio (hier:<br />

(1/40) −1 = 0, 025) de class skew benadert (in te realistische test: 0, 02). In test 19 worden<br />

de negatieve documenten gedefinieerd aan de hand van slechts 50 features. Uitprinten<br />

van deze 50 features (zie bijlage A.3, p. 64) toont dat het om zeer frequente woorden

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!