Paper - Hogeschool Gent
Paper - Hogeschool Gent
Paper - Hogeschool Gent
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Hoofdstuk 5. Resultaten 35<br />
Beoordelingsparameters<br />
De beoordeling van de uitgewerkte technologieën gebeurt aan de hand van enkele stan-<br />
daardparameters. Deze zijn respectievelijk de precision (P), de recall (R), de F1 measure<br />
(F1), de true positive rate (TPR) en de false positive rate (FPR). Om deze begrippen te ver-<br />
duidelijken, wordt gebruikgemaakt van volgende terminologie, samengevat in onderstaande<br />
tabel:<br />
Beoordeling<br />
Werkelijkheid<br />
true false<br />
true true positive (TP) false positive (FP)<br />
false false negative (FN) true negative (TN)<br />
Tabel 5.1: Een overzicht van de soorten beoordelingen.<br />
False positives en false negatives worden ook wel type I en type II fouten genoemd.<br />
De grootheden voor de beoordelingen worden nu als volgt gedefinieerd:<br />
T P<br />
T P +F P<br />
De fractie van het aantal positief geklasseerde documenten die juist geklasseerd zijn.<br />
precision =<br />
T P<br />
T P +F N<br />
De fractie van het aantal positive documenten die gevonden zijn.<br />
recall =<br />
2×P ×R<br />
P +R<br />
Het gewogen gemiddelde van de precision en de recall.<br />
F1 measure =<br />
true positive rate =<br />
T P<br />
P<br />
= T P<br />
T P +F N<br />
Dit komt overeen met de recall.<br />
false positive rate =<br />
F P<br />
N<br />
= F P<br />
F P +T N<br />
In de tests wordt gestreefd naar een algoritme die een zo goed mogelijke afweging maakt<br />
tussen precision en recall. De F1 measure moet dus maximaal zijn. Er moet opgemerkt<br />
worden dat alle concrete cijfergegevens afkomstig zijn uit eigen tests, geoptimaliseerd waar<br />
mogelijk voor de eigen data.